DEMO DEL CRÍTICO EN VIVO
Esta demo usa el runtime real de evaluación en este repositorio: cree una ejecución, obtenga la puntuación, revise el borrador e itere con el mismo ciclo de crítico hostil que el producto expone a los agentes.
Contrato de runtime
La página envía a `/api/v1/eval/runs`, obtiene `/api/v1/eval/runs/{id}/score` y itera con `/api/v1/eval/runs/{id}/iterate` con `decision=re_prompt`.
Ejecute una calificación para ver fallos en vivo, mejoras y deltas de revisión.