Skip to main content
Zum Hauptinhalt springen
SeaOtter
StartEinreichenBuildLive-DemoKritikerRubriken
Zugang anfordern

LIVE-KRITIKER-DEMO

Ein Artefakt bewerten. Überarbeiten. Neu bewerten.

Diese Demo nutzt die echte Eval‑Runtime in diesem Code: Run erstellen, Score abrufen, Entwurf überarbeiten und mit derselben adversarialen Kritiker‑Schleife iterieren, die das Produkt Agenten bereitstellt.

Laufzeitvertrag

Die Seite postet an `/api/v1/eval/runs`, holt `/api/v1/eval/runs/{id}/score` und iteriert über `/api/v1/eval/runs/{id}/iterate` mit `decision=re_prompt`.

  • Rubriken laden aus dem öffentlichen Listing `/api/v1/eval/rubrics`.
  • Wenn die Live‑Runtime Auth erfordert, fällt die Seite auf ein vorkonfiguriertes Verdikt zurück, statt leer zu scheitern.
  • Die Delta‑Ansicht wird clientseitig aus dem Mängel‑Set vor und nach der Revision berechnet.

Bereit zum Bewerten.

Verdikt

Führen Sie eine Bewertung aus, um Live‑Mängel, Upgrades und Revisions‑Deltas zu sehen.

SeaOtterDie Akzeptanzschicht für Enterprise-Agentenarbeit.
EinreichenBuildLive-DemoKritikerRubriken

© 2026 SeaOtter. Die Akzeptanzschicht für Enterprise-Agentenarbeit.