LIVE-KRITIKER-DEMO
Diese Demo nutzt die echte Eval‑Runtime in diesem Code: Run erstellen, Score abrufen, Entwurf überarbeiten und mit derselben adversarialen Kritiker‑Schleife iterieren, die das Produkt Agenten bereitstellt.
Laufzeitvertrag
Die Seite postet an `/api/v1/eval/runs`, holt `/api/v1/eval/runs/{id}/score` und iteriert über `/api/v1/eval/runs/{id}/iterate` mit `decision=re_prompt`.
Führen Sie eine Bewertung aus, um Live‑Mängel, Upgrades und Revisions‑Deltas zu sehen.