DEMO DEL CRITICO LIVE
Questa demo usa il runtime di valutazione reale in questo codebase: crei un run, recuperi il punteggio, riveda la bozza e itera con lo stesso ciclo di critico ostile che il prodotto espone agli agenti.
Contratto runtime
La pagina invia post a `/api/v1/eval/runs`, recupera `/api/v1/eval/runs/{id}/score` e itera tramite `/api/v1/eval/runs/{id}/iterate` con `decision=re_prompt`.
Esegua una valutazione per vedere difetti live, miglioramenti e delta di revisione.