Skip to main content
Aller au contenu principal
SeaOtter
AccueilSoumettreBuildDémo en directCritiquesRubriques
Demander l’accès

DÉMO DE CRITIQUE EN DIRECT

Notez un artefact. Révisez-le. Re-notez-le.

Cette démo utilise le runtime d’évaluation réel de ce codebase : créez un run, récupérez le score, révisez le brouillon et itérez avec la même boucle de critique hostile que le produit expose aux agents.

Contrat d’exécution

La page publie sur `/api/v1/eval/runs`, récupère `/api/v1/eval/runs/{id}/score`, et itère via `/api/v1/eval/runs/{id}/iterate` avec `decision=re_prompt`.

  • Les rubriques se chargent depuis la liste publique `/api/v1/eval/rubrics`.
  • Si le runtime en direct requiert une authentification, la page revient à un verdict figé au lieu d’échouer à blanc.
  • La vue delta est calculée côté client d’après l’ensemble de défauts avant et après révision.

Prêt à noter.

Verdict

Lancez une notation pour voir les défauts en direct, les améliorations et les deltas de révision.

SeaOtterLa couche d’acceptation pour le travail des agents en entreprise.
SoumettreBuildDémo en directCritiquesRubriques

© 2026 SeaOtter. La couche d’acceptation pour le travail des agents en entreprise.