DÉMO DE CRITIQUE EN DIRECT
Cette démo utilise le runtime d’évaluation réel de ce codebase : créez un run, récupérez le score, révisez le brouillon et itérez avec la même boucle de critique hostile que le produit expose aux agents.
Contrat d’exécution
La page publie sur `/api/v1/eval/runs`, récupère `/api/v1/eval/runs/{id}/score`, et itère via `/api/v1/eval/runs/{id}/iterate` avec `decision=re_prompt`.
Lancez une notation pour voir les défauts en direct, les améliorations et les deltas de révision.