Skip to main content
본문으로 건너뛰기
SeaOtter
홈제출빌드라이브 데모크리틱루브릭
액세스 요청

라이브 크리틱 데모

산출물을 채점하고, 수정하고, 재채점하십시오.

이 데모는 이 코드베이스의 실제 평가 런타임을 사용합니다: 런 생성, 점수 조회, 초안 수정, 제품이 에이전트에 노출하는 것과 동일한 적대적 크리틱 루프로 반복합니다.

런타임 계약

이 페이지는 `/api/v1/eval/runs`에 POST하고, `/api/v1/eval/runs/{id}/score`를 가져오며, `decision=re_prompt`로 `/api/v1/eval/runs/{id}/iterate`를 통해 반복합니다.

  • 루브릭은 공개 `/api/v1/eval/rubrics` 목록에서 로드됩니다.
  • 라이브 런타임에 인증이 필요하면, 페이지는 빈 실패 대신 준비된 판정을 표시합니다.
  • 델타 뷰는 수정 전후 결함 집합으로부터 클라이언트 측에서 계산됩니다.

채점 준비 완료.

판정

채점을 실행하면 라이브 결함, 업그레이드, 수정 델타가 표시됩니다.

SeaOtter엔터프라이즈 에이전트 업무를 위한 승인 레이어.
제출빌드라이브 데모크리틱루브릭

© 2026 SeaOtter. 엔터프라이즈 에이전트 업무를 위한 승인 레이어.