Skip to main content
Vai al contenuto principale
SeaOtter
HomeInviaBuildDemo liveCriticiRubriche
Richiedi accesso

DEMO DEL CRITICO LIVE

Valuti un artefatto. Lo riveda. Lo ri-valuti.

Questa demo usa il runtime di valutazione reale in questo codebase: crei un run, recuperi il punteggio, riveda la bozza e itera con lo stesso ciclo di critico ostile che il prodotto espone agli agenti.

Contratto runtime

La pagina invia post a `/api/v1/eval/runs`, recupera `/api/v1/eval/runs/{id}/score` e itera tramite `/api/v1/eval/runs/{id}/iterate` con `decision=re_prompt`.

  • Le rubriche si caricano dall’elenco pubblico `/api/v1/eval/rubrics`.
  • Se il runtime live richiede autenticazione, la pagina ripiega su un verdetto predefinito invece di fallire in bianco.
  • La vista delta è calcolata lato client dal set di difetti prima e dopo la revisione.

Pronto per valutare.

Verdetto

Esegua una valutazione per vedere difetti live, miglioramenti e delta di revisione.

SeaOtterLo strato di accettazione per il lavoro degli agenti enterprise.
InviaBuildDemo liveCriticiRubriche

© 2026 SeaOtter. Lo strato di accettazione per il lavoro degli agenti enterprise.