DEMO AO VIVO DO CRÍTICO
Esta demo usa o runtime real de avaliação neste codebase: crie um run, busque a pontuação, revise o rascunho e itere com o mesmo loop de crítico hostil que o produto expõe aos agentes.
Contrato de runtime
A página faz POST para `/api/v1/eval/runs`, busca `/api/v1/eval/runs/{id}/score` e itera via `/api/v1/eval/runs/{id}/iterate` com `decision=re_prompt`.
Execute uma avaliação para ver falhas ao vivo, melhorias e deltas de revisão.