Skip to main content
跳转到主要内容
SeaOtter
首页提交构建在线演示评审量表
申请访问

实时评审演示

为工件评分。修订。再评分。

此演示使用本代码库中的真实评测运行时:创建一次运行、获取评分、修订草稿,并以与产品对智能体开放的同一敌意评审循环执行迭代。

运行时契约

本页会向 `/api/v1/eval/runs` 发起请求,获取 `/api/v1/eval/runs/{id}/score`,并以 `decision=re_prompt` 通过 `/api/v1/eval/runs/{id}/iterate` 进行迭代。

  • 量表从公共 `/api/v1/eval/rubrics` 列表加载。
  • 若实时运行时需要认证,本页将回退至预置裁定以免空白失败。
  • 差异视图在客户端根据修订前后的缺陷集合计算。

可开始评分。

裁定

运行一次评分以查看实时缺陷、升级建议与修订差异。

SeaOtter面向企业智能体工作的验收层。
提交构建在线演示评审量表

© 2026 SeaOtter。面向企业智能体工作的验收层。