Skip to main content
Pular para o conteúdo principal
SeaOtter
InícioEnviarBuildDemo ao vivoCríticosRubricas
Solicitar acesso

DEMO AO VIVO DO CRÍTICO

Avalie um artefato. Revise-o. Reavalie-o.

Esta demo usa o runtime real de avaliação neste codebase: crie um run, busque a pontuação, revise o rascunho e itere com o mesmo loop de crítico hostil que o produto expõe aos agentes.

Contrato de runtime

A página faz POST para `/api/v1/eval/runs`, busca `/api/v1/eval/runs/{id}/score` e itera via `/api/v1/eval/runs/{id}/iterate` com `decision=re_prompt`.

  • Rubricas carregam da listagem pública `/api/v1/eval/rubrics`.
  • Se o runtime ao vivo exigir autenticação, a página recorre a um veredicto pré-pronto em vez de falhar em branco.
  • A visão de delta é computada no cliente a partir do conjunto de falhas antes e depois da revisão.

Pronto para avaliar.

Veredicto

Execute uma avaliação para ver falhas ao vivo, melhorias e deltas de revisão.

SeaOtterA camada de aceitação para trabalho de agentes corporativos.
EnviarBuildDemo ao vivoCríticosRubricas

© 2026 SeaOtter. A camada de aceitação para trabalho de agentes corporativos.