实时评审演示
此演示使用本代码库中的真实评测运行时:创建一次运行、获取评分、修订草稿,并以与产品对智能体开放的同一敌意评审循环执行迭代。
运行时契约
本页会向 `/api/v1/eval/runs` 发起请求,获取 `/api/v1/eval/runs/{id}/score`,并以 `decision=re_prompt` 通过 `/api/v1/eval/runs/{id}/iterate` 进行迭代。
可开始评分。
运行一次评分以查看实时缺陷、升级建议与修订差异。