طبقة القبول لأعمال الوكلاء الأذكياء على نطاق واسع

الوكلاء الأذكياء يُنتجون عملاً
أسرع من أي أحدٍ
يمكنه مراجعته.

يشحن الوكلاء الأذكياء عملاً أسرع مما تستطيع أيُّ فرقٍ مراجعته. يُقيّم ناقد SeaOtter كل مُخرَج ويدفع بتصحيحات حتى يجتاز سياستكم — وكيل ذكي↔ناقد، بسرعة الآلة.

جرّب العرض المباشر اطّلع على آلية العمل ↓

للوكلاء الأذكياءاحصل على مفتاح API + MCPسجّل، واتصل عبر MCP أو HTTP، وقيّم واعمل تكرارياً على العمل برمجياً.للأشخاصأرسل عملاً للمراجعةحمّل عمل وكيلك الذكي لتحصل على OtterScore مع العيوب الواجب إصلاحها.

اقرأ التوثيق

كانت المراجعة البشرية هي الحلقة. على نطاق الوكلاء الأذكياء، تصبح عنق الزجاجة.

على نطاق الوكلاء الأذكياء

نموذج ناقد عدائي يقرأ العمل — ويقرر.

يُرسل وكيل ذكي عملاً للتقييم. يُوَجِّه إلى تمريرة أحادية سريعة — أو فحص وكيلي عميق يشغّل العمل في بيئة معزولة ويفحصه. يقرر نموذج ناقد عدائي، وتدفع مقابل الحوسبة التي استهلكها. ثم تراجع المشهد: آلاف الوكلاء الأذكياء، مُقيّمون بالتوازي، متزامناً أو غير متزامن.

12,480قطع من أعمال الوكلاء الأذكياءتمت مراجعتها بالتوازي عبر OtterScore — وكيل ذكي ناقد عدائي

9,734إطلاق1,997مسار للإصلاح749حجب

تغذية راجعة مُحَلْيَة

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.
تثبّت SeaOtter المدى الدقيق وتسمّي الملف.

لا يكتفي الناقد بالقول إن هناك خطأ. إنّه يحدد موضع المشكلة كي يراجع الوكيل الذكي السطر أو الصفحة أو الشريحة أو الخلية أو الإطار أو الطابع الزمني الذي فشل تحديداً.

encode/starlette · BSD-3-Clause · سَحْب OSS عام

إشارة بدون موقعغير محدد الموضع

"قد تكون هناك مشكلة ما في هذا المُخرج."

لا مدى. لا ملف. لا مسار تمرير.

ناقد SeaOtterالسطر 30

hallucinated_api · عالية

self.tasks.add_item(task)

add_item ليست طريقة صالحة على list، لذا سيتسبب هذا بخطأ وقت التشغيل. المتوقع self.tasks.append(task).

F1 للتوطين — هل يُثبّت العيب؟

تقييم مبكر · n=256 · مُتحقق على عينة محجوزة

ناقد SeaOtter

0.218

قراءة مبكرة، متحققة عبر عينة محجوزة، لقدرة ناقدنا على تثبيت المدى الدقيق وتسميه الملف. لا يزال الاكتشاف قيد التدريب النشط؛ الادعاء هنا يتعلق بجودة التوطين، لا النقد العام.

إرسال → تقييم

أرسل عملاً واحصل على تقييم — متزامن أو غير متزامن.

يُجري وكيل ذكي طلب POST للعمل الذي أنتجه للتو، وتُقيّمه SeaOtter مقابل سياسة القبول لديك. الفحوصات الصغيرة والسريعة تُرجع الحكم ضمن الاستجابة. الفحوصات الأثقل تُرجع معرّف مهمة يستطلعُه الوكيل الذكي أو يبثه أو يتلقّاه عبر webhook — بحيث لا يحجب فحصٌ طويل الوكيلَ الذي طلبه.

للأشخاص

البشر — أعد التوجيه أو الصق

أرسل العمل إلى صندوق SeaOtter لتحصل على ردّ OtterScore مُقيّماً، أو الصقه على الويب وقيّمه في المتصفح. لا حاجة لوكيل ذكي.

أرسل عبر الويب راسل صندوق SeaOtter

للوكلاء الأذكياء

الوكلاء — API وMCP

أوصل أي وكيل ذكي عبر HTTP أو MCP ليُقيّم مُخرجاته داخل الحلقة — السياسة نفسها وOtterScore نفسه، بسرعة الآلة. دليل البدء خلال 60 ثانية أدناه مباشرة.

افتح وحدة المطوّر

متزامن

أرسل وانتظر الحكم

أرسل العمل عبر POST، واحتفظ بالاتصال، واحصل على حكم OtterScore — النطاق والعيوب والمؤشرات الموضعية والتحسينات — في الاستجابة نفسها. الأفضل لفحص أحادي ضمن الحلقة الداخلية لوكيل ذكي حيث يحتاج الوكيل الإجابة قبل خطوته التالية.

POST /api/v1/eval/score → 200 { band, flaws[], upgrades[] }

غير متزامن

أرسل، ثم احصل على معرّف مهمة، واجمع النتيجة لاحقاً

أرسل العمل عبر POST، واحصل فوراً على معرّف مهمة، ثم استطلع المهمة أو اشترك في تدفق النتيجة أو سجّل webhook. الأفضل لفحص وكيلي يشغّل العمل في بيئة معزولة عبر عدة تمريرات — الوكيل المنتج يتابع ويُستدعى عند صدور الحكم.

POST /api/v1/eval/jobs → 202 { job_id } · استعلام · بث (SSE) · webhook

متزامن · أحادي

تمرير ناقد عدائي واحد، يُعاد ضمن الاستجابة. منخفض وبتسعير ثابت.

curl -s https://dev-api.seaotter.ai/api/v1/eval/score \
  -H "Authorization: Bearer $OTTER_KEY" -H 'Content-Type: application/json' \
  -d '{ "mode":"one_shot", "modality":"text",
        "policy_id":"acme-prod-acceptance",
        "artifact_parts":[{"mime_type":"text/plain","text":"..."}] }'
# 200 { "band":"route_to_fix", "flaws":[...], "upgrades":[...] }

غير متزامن · وكيلي

يشغّل الناقد العمل في بيئة معزولة ويفحصه عبر عدة تمريرات.

POST /api/v1/eval/jobs
  { "mode":"agentic", "modality":"code",
    "policy_id":"acme-prod-acceptance",
    "artifact_ref":"gs://...", "max_passes":6,
    "webhook":"https://acme.internal/otter-callback" }
# 202 { "job_id":"job_8f21", "status":"running" }
GET /api/v1/eval/jobs/job_8f21   # poll, or stream, or await the webhook

نفس السياسة، ونفس OtterScore، ونفس سجل التدقيق الموقّع — أيّاً كان النقل الذي يختاره الوكيل الذكي.

للوكلاء الأذكياء · البدء السريع MCP

صلْ وكيلك الذكي بالناقد العدائي خلال 60 ثانية.

ثلاث خطوات: أنشئ مفتاحاً، أضف خادماً واحداً لـ MCP، ثم يستدعي وكيلك otter_score / otter_iterate داخل حلقته — OtterScore نفسه وسياسة القبول ذاتها، بسرعة الآلة. الناقد يُقيّم؛ ووكيلك يُراجع وفق العيوب حتى يجتاز النطاق البوابة. هذه هي الحلقة التي شاهدتها في الأسطول أعلاه: كل مُخرج مُعلّم (route_to_fix، القوس الكهرماني) يُعاد إدخاله عبر otter_iterate ولا يُشحن إلا عندما تكون ready_to_ship = true. لا بشري في الحلقة الداخلية — التوقيع الاسمي هو البوابة الأخيرة، لا الوحيدة.

تسجيل

ينشئ مستخدم مؤسسي موقّع مفتاح تقييم الوكيل مرة واحدة. يُعرض سر sk-otter-… مرة واحدة فقط؛ سلّمه للوكيل.

أضف خادم MCP

أدرج خادماً واحداً otterloop في .mcp.json (Claude / Cursor) أو config.toml (Codex). يحصل الوكيل على أدوات ناقد للقراءة فقط يمكنه اعتمادها آلياً.

قيِّم وكرّر

يُرسل الوكيل العمل، ويقرأ العيوب المُثبتة، ويُراجع، ويُعيد الإرسال — ويستمر بالدوران بينما ready_to_ship = false. اجتياز الناقد هو المُنتَج.

1 — تسجيل

POST /api/v1/agent-keys برمز JWT لمستخدم مسجّل. يُعاد السر مرة واحدة — أو انقر "Generate eval API key" في وحدة المطوّر.

curl -s -X POST https://dev-api.seaotter.ai/api/v1/agent-keys \
  -H "Authorization: Bearer $SEAOTTER_USER_JWT" \
  -H 'Content-Type: application/json' \
  -d '{"name":"my-agent"}'
# -> { "id":"...", "key":"sk-otter-...",
#      "key_prefix":"sk-otter-abcde", "created_at":"..." }
# سلّم `key` للوكيل كـ OTTERLOOP_API_KEY.

2 — أضف خادم MCP

.mcp.json (Claude / Cursor) — يستخدم Codex [mcp_servers.otterloop] في config.toml. ثبّت مرة: pip install "otterloop[mcp]". قاعدة الإنتاج: https://api.seaotter.ai.

{
  "mcpServers": {
    "otterloop": {
      "command": "python",
      "args": ["-m", "otterloop.mcp_server"],
      "env": {
        "OTTERLOOP_API_URL": "https://dev-api.seaotter.ai",
        "OTTERLOOP_API_KEY": "sk-otter-...",
        "OTTERLOOP_POLICY_ID": "enterprise-default"
      }
    }
  }
}
# الأدوات: otter_list_policies · otter_score · otter_iterate
#        otter_score_workflow · otter_get_feedback_artifact

3 — قيِّم وكرّر

يشغّل الوكيل الإرسال → العيوب → المراجعة → إعادة الإرسال كلياً عبر MCP. اعتبر الحكم مُلزِماً — لا تُقيِّم نفسك.

# أرسل عملك -> حكم مُلزِم
v = otter_score(
      work="...the artifact your agent produced...",
      modality="text",
      prompt="Draft the Q3 incident postmortem",
      policy_id="enterprise-default")
# -> { run_id, score, band:"route_to_fix",
#      flaws:[{criterion,severity,detail,anchor}],
#      upgrades:[...], ready_to_ship:false }

# راجع مقابل flaws[]/upgrades[]، ثم أعد إرسال نفس التشغيل
d = otter_iterate(
      run_id=v["run_id"],
      work="...revised draft addressing the flaws...",
      prompt="addressed sourcing + tone")
# -> { run_id, verdict:{band:"ship",...},
#      delta:{resolved_flaws,new_flaws,persisted_flaws,
#             score_change:+18.0}, ready_to_ship:true }

# استمر بالتكرار ما دامت ready_to_ship = false.

كرّر → تتقارب

ما يُعيده otter_iterate — التقارب نفسه من route_to_fix → ship الذي يصوّره الأسطول أعلاه، مجمّداً كفروقات مقروءة.

route_to_fixship

resolved_flaws ↓ 2 · score_change ↑ +18.0 · ready_to_ship → true

المكافئ عبر HTTP فقط (بدون MCP): POST /api/v1/eval/runs → { run_id, first_iteration.critic_verdict }، ثم POST /api/v1/eval/runs/{run_id}/iterate { "decision":"re_prompt", "new_artifact_parts":[…] } → { verdict, delta }. أي انقطاع في الناقد يفشل مغلقاً (band:quarantine) — لا مرور صامت أبداً.

أنشئ مفتاح التقييم جرّب العرض المباشر

نَمَطان من الفحص

أحادي أو وكيلي. أنت تختار العمق.

ليست كل المخرجات بحاجة إلى نفس مستوى التدقيق. الفحص الأحادي تمريرة ناقد عدائية واحدة — سريع، قليل الحوسبة، يُعاد ضمن الاستجابة. الفحص الوكيلي يشغّل العمل في بيئة معزولة قادرة على الوصول للإنترنت ويفحصه عبر عدة تمريرات — أبطأ، أكثر حوسبة، يُعاد بشكل غير متزامن. وجّه الأعمال الرخيصة إلى الفحص الأحادي والأعمال عالية المخاطر إلى الفحص الوكيلي، على السياسة نفسها.

	أحاديتمريرة عدائية واحدة	وكيليبيئة معزولة، عدة تمريرات
ما يفعله الناقد	يقرأ المُخرج والسياسة والموجه والمراجع في تمريرة واحدة.	يشغّل العمل في بيئة معزولة يمكن التخلص منها ويفحصه عبر عدة تمريرات.
الكمون	ضمن الاستجابة — الحكم في الرد.	غير متزامن — معرّف مهمة، ثم استعلام أو بث أو webhook.
الحوسبة	منخفضة ومتوقعة.	أعلى — يتناسب مع عدد التمريرات ووقت البيئة المعزولة.
الأفضل لأجل	فحوصات الحلقة الداخلية، المسودات عالية الحجم، البوابات السريعة.	شيفرة يجب تشغيلها، ادعاءات يجب إعادة إنتاجها، أعمال ذات أثر واسع.
الفوترة	رخيص، بسعر ثابت لكل فحص.	مقاس حسب الحوسبة ووقت البيئة المعزولة.

كلا النمطين يُعيدان شكل حكم OtterScore نفسه ويكتبان سجل التدقيق الموقّع نفسه.

تسعير قائم على الاستخدام

ادفع مقابل العمل المُنجَز.

تُحاسَب على التقييم الذي تُشغِّله فعلياً، لا على عدد المقاعد. الفحص الأحادي رخيص وبتسعير ثابت؛ الفحص الوكيلي مقاس حسب الحوسبة ووقت البيئة المعزولة الذي يستغرقه. هذا ما يجعل تقييم كل مُخرج — وكل الأسطول — اقتصادياً، بدلاً من تقنين المراجعة على عينة.

فحص أحادي

رخيص، بسعر ثابت

لكل فحص، ثابت

تمريرة ناقد عدائية واحدة، تُعاد ضمن الاستجابة. مُسعَّرة بما يكفي للجلوس داخل الحلقة الداخلية لكل وكيل ذكي وتقييم المسودات عالية الحجم.

فحص وكيلي

مقاس حسب الحوسبة

مقاس حسب الحوسبة + وقت البيئة المعزولة

مراجعة متعددة التمريرات في بيئة معزولة. تدفع مقابل التمريرات ووقت البيئة الذي يحتاجه العمل فعلياً — احتفظ به للمخرجات عالية المخاطر حيث يبرر تكلفته.

جرّب العرض المباشر اقرأ مستندات API

يظل النشر المؤسسي التشغيل الموازي → فرض → مُدار؛ ويقيس التسعير القائم على الاستخدام العملَ في الأسفل. عرض تكلفة مفصل متاح عند الطلب.

OTTERLOOP INFRA

ضع الناقد في حلقة كل وكيل ذكي.

MCP + HTTP + Python SDKلا بشري في الحلقة الداخليةمتعدد الوسائط دخولاً وخروجاًمكيف على سياستكم

إنتاج

أي وكيل ذكي يُخرج عملاً: شيفرة، نص، صورة، عرض، ورقة عمل، فيديو، أو مسار كامل.

تقييم

تُقيّمه SeaOtter مقابل المصفوفة الصحيحة وحاجز المؤسسة المكيّف.

قراءة التغذية الراجعة

يعود الحكم بعيوب وتحسينات ومؤشرات موضعية يمكن للوكيل الذكي استهدافها مباشرة.

مراجعة

يُعيد الوكيل الذكي كتابة المُخرج أو الخطوة التالية باستخدام دفع الناقد العكسي.

إطلاق

تتوقف الحلقة فقط عندما يجتاز النطاق البوابة وتُكتب أدلة التدقيق.

جرّب العرض المباشر افتح صفحة الإنشاء

MCP

أدرجه في `.mcp.json` أو `config.toml` لـ Claude أو Codex أو Cursor أو بيئة تشغيل مخصصة.

{ "mcpServers": { "otterloop": {
    "command": "python", "args": ["-m", "otterloop.mcp_server"],
    "env": { "OTTERLOOP_API_URL": "https://dev-api.seaotter.ai",
             "OTTERLOOP_API_KEY": "sk-otter-...",
             "OTTERLOOP_POLICY_ID": "acme-prod-acceptance" } } } }

curl

أي بيئة تشغيل تتحدث HTTP يمكنها التقييم مرة واحدة أو البقاء في الحلقة.

curl -s https://dev-api.seaotter.ai/api/v1/eval/feedback \
  -H "Authorization: Bearer $OTTER_KEY" -H 'Content-Type: application/json' \
  -d '{ "modality":"text", "policy_id":"acme-prod-acceptance", "locale":"ja",
        "prompt":"Draft the Q3 incident postmortem",
        "artifact_parts":[{"mime_type":"text/plain","text":"..."}],
        "return_feedback_artifacts": true }'

Python SDK

نداء حلقة واحد يقود الإنتاج → التقييم → المراجعة حتى يقول الناقد «اشحن».

from otterloop import OtterLoopClient
otter = OtterLoopClient(policy_id="acme-prod-acceptance", locale="ja")
final = otter.loop(produce=lambda feedback: my_agent.revise(feedback), work=my_agent.first_draft(), modality="document", references=["file://brand-guide.pdf", "file://gold-postmortem.md"], max_rounds=5, target_band="ship")

SeaOtterطلب الوصول

طبقة القبول لأعمال الوكلاء الأذكياء على نطاق واسع

الوكلاء الأذكياء يُنتجون عملاً
أسرع من أي أحدٍ
يمكنه مراجعته.

جرّب العرض المباشر اطّلع على آلية العمل ↓

اقرأ التوثيق

كانت المراجعة البشرية هي الحلقة. على نطاق الوكلاء الأذكياء، تصبح عنق الزجاجة.

على نطاق الوكلاء الأذكياء

نموذج ناقد عدائي يقرأ العمل — ويقرر.

12,480قطع من أعمال الوكلاء الأذكياءتمت مراجعتها بالتوازي عبر OtterScore — وكيل ذكي ناقد عدائي

9,734إطلاق1,997مسار للإصلاح749حجب

تغذية راجعة مُحَلْيَة

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.
تثبّت SeaOtter المدى الدقيق وتسمّي الملف.

encode/starlette · BSD-3-Clause · سَحْب OSS عام

إشارة بدون موقعغير محدد الموضع

"قد تكون هناك مشكلة ما في هذا المُخرج."

لا مدى. لا ملف. لا مسار تمرير.

ناقد SeaOtterالسطر 30

hallucinated_api · عالية

self.tasks.add_item(task)

add_item ليست طريقة صالحة على list، لذا سيتسبب هذا بخطأ وقت التشغيل. المتوقع self.tasks.append(task).

F1 للتوطين — هل يُثبّت العيب؟

تقييم مبكر · n=256 · مُتحقق على عينة محجوزة

ناقد SeaOtter

0.218

إرسال → تقييم

أرسل عملاً واحصل على تقييم — متزامن أو غير متزامن.

للأشخاص

البشر — أعد التوجيه أو الصق

أرسل عبر الويب راسل صندوق SeaOtter

للوكلاء الأذكياء

الوكلاء — API وMCP

افتح وحدة المطوّر

متزامن

أرسل وانتظر الحكم

POST /api/v1/eval/score → 200 { band, flaws[], upgrades[] }

غير متزامن

أرسل، ثم احصل على معرّف مهمة، واجمع النتيجة لاحقاً

POST /api/v1/eval/jobs → 202 { job_id } · استعلام · بث (SSE) · webhook

متزامن · أحادي

تمرير ناقد عدائي واحد، يُعاد ضمن الاستجابة. منخفض وبتسعير ثابت.

curl -s https://dev-api.seaotter.ai/api/v1/eval/score \
  -H "Authorization: Bearer $OTTER_KEY" -H 'Content-Type: application/json' \
  -d '{ "mode":"one_shot", "modality":"text",
        "policy_id":"acme-prod-acceptance",
        "artifact_parts":[{"mime_type":"text/plain","text":"..."}] }'
# 200 { "band":"route_to_fix", "flaws":[...], "upgrades":[...] }

غير متزامن · وكيلي

يشغّل الناقد العمل في بيئة معزولة ويفحصه عبر عدة تمريرات.

POST /api/v1/eval/jobs
  { "mode":"agentic", "modality":"code",
    "policy_id":"acme-prod-acceptance",
    "artifact_ref":"gs://...", "max_passes":6,
    "webhook":"https://acme.internal/otter-callback" }
# 202 { "job_id":"job_8f21", "status":"running" }
GET /api/v1/eval/jobs/job_8f21   # poll, or stream, or await the webhook

نفس السياسة، ونفس OtterScore، ونفس سجل التدقيق الموقّع — أيّاً كان النقل الذي يختاره الوكيل الذكي.

للوكلاء الأذكياء · البدء السريع MCP

صلْ وكيلك الذكي بالناقد العدائي خلال 60 ثانية.

تسجيل

ينشئ مستخدم مؤسسي موقّع مفتاح تقييم الوكيل مرة واحدة. يُعرض سر sk-otter-… مرة واحدة فقط؛ سلّمه للوكيل.

أضف خادم MCP

قيِّم وكرّر

1 — تسجيل

POST /api/v1/agent-keys برمز JWT لمستخدم مسجّل. يُعاد السر مرة واحدة — أو انقر "Generate eval API key" في وحدة المطوّر.

curl -s -X POST https://dev-api.seaotter.ai/api/v1/agent-keys \
  -H "Authorization: Bearer $SEAOTTER_USER_JWT" \
  -H 'Content-Type: application/json' \
  -d '{"name":"my-agent"}'
# -> { "id":"...", "key":"sk-otter-...",
#      "key_prefix":"sk-otter-abcde", "created_at":"..." }
# سلّم `key` للوكيل كـ OTTERLOOP_API_KEY.

2 — أضف خادم MCP

.mcp.json (Claude / Cursor) — يستخدم Codex [mcp_servers.otterloop] في config.toml. ثبّت مرة: pip install "otterloop[mcp]". قاعدة الإنتاج: https://api.seaotter.ai.

{
  "mcpServers": {
    "otterloop": {
      "command": "python",
      "args": ["-m", "otterloop.mcp_server"],
      "env": {
        "OTTERLOOP_API_URL": "https://dev-api.seaotter.ai",
        "OTTERLOOP_API_KEY": "sk-otter-...",
        "OTTERLOOP_POLICY_ID": "enterprise-default"
      }
    }
  }
}
# الأدوات: otter_list_policies · otter_score · otter_iterate
#        otter_score_workflow · otter_get_feedback_artifact

3 — قيِّم وكرّر

# أرسل عملك -> حكم مُلزِم
v = otter_score(
      work="...the artifact your agent produced...",
      modality="text",
      prompt="Draft the Q3 incident postmortem",
      policy_id="enterprise-default")
# -> { run_id, score, band:"route_to_fix",
#      flaws:[{criterion,severity,detail,anchor}],
#      upgrades:[...], ready_to_ship:false }

# راجع مقابل flaws[]/upgrades[]، ثم أعد إرسال نفس التشغيل
d = otter_iterate(
      run_id=v["run_id"],
      work="...revised draft addressing the flaws...",
      prompt="addressed sourcing + tone")
# -> { run_id, verdict:{band:"ship",...},
#      delta:{resolved_flaws,new_flaws,persisted_flaws,
#             score_change:+18.0}, ready_to_ship:true }

# استمر بالتكرار ما دامت ready_to_ship = false.

كرّر → تتقارب

ما يُعيده otter_iterate — التقارب نفسه من route_to_fix → ship الذي يصوّره الأسطول أعلاه، مجمّداً كفروقات مقروءة.

route_to_fixship

resolved_flaws ↓ 2 · score_change ↑ +18.0 · ready_to_ship → true

أنشئ مفتاح التقييم جرّب العرض المباشر

نَمَطان من الفحص

أحادي أو وكيلي. أنت تختار العمق.

	أحاديتمريرة عدائية واحدة	وكيليبيئة معزولة، عدة تمريرات
ما يفعله الناقد	يقرأ المُخرج والسياسة والموجه والمراجع في تمريرة واحدة.	يشغّل العمل في بيئة معزولة يمكن التخلص منها ويفحصه عبر عدة تمريرات.
الكمون	ضمن الاستجابة — الحكم في الرد.	غير متزامن — معرّف مهمة، ثم استعلام أو بث أو webhook.
الحوسبة	منخفضة ومتوقعة.	أعلى — يتناسب مع عدد التمريرات ووقت البيئة المعزولة.
الأفضل لأجل	فحوصات الحلقة الداخلية، المسودات عالية الحجم، البوابات السريعة.	شيفرة يجب تشغيلها، ادعاءات يجب إعادة إنتاجها، أعمال ذات أثر واسع.
الفوترة	رخيص، بسعر ثابت لكل فحص.	مقاس حسب الحوسبة ووقت البيئة المعزولة.

كلا النمطين يُعيدان شكل حكم OtterScore نفسه ويكتبان سجل التدقيق الموقّع نفسه.

تسعير قائم على الاستخدام

ادفع مقابل العمل المُنجَز.

فحص أحادي

رخيص، بسعر ثابت

لكل فحص، ثابت

فحص وكيلي

مقاس حسب الحوسبة

مقاس حسب الحوسبة + وقت البيئة المعزولة

جرّب العرض المباشر اقرأ مستندات API

OTTERLOOP INFRA

ضع الناقد في حلقة كل وكيل ذكي.

MCP + HTTP + Python SDKلا بشري في الحلقة الداخليةمتعدد الوسائط دخولاً وخروجاًمكيف على سياستكم

إنتاج

أي وكيل ذكي يُخرج عملاً: شيفرة، نص، صورة، عرض، ورقة عمل، فيديو، أو مسار كامل.

تقييم

تُقيّمه SeaOtter مقابل المصفوفة الصحيحة وحاجز المؤسسة المكيّف.

قراءة التغذية الراجعة

يعود الحكم بعيوب وتحسينات ومؤشرات موضعية يمكن للوكيل الذكي استهدافها مباشرة.

مراجعة

يُعيد الوكيل الذكي كتابة المُخرج أو الخطوة التالية باستخدام دفع الناقد العكسي.

إطلاق

تتوقف الحلقة فقط عندما يجتاز النطاق البوابة وتُكتب أدلة التدقيق.

جرّب العرض المباشر افتح صفحة الإنشاء

MCP

أدرجه في `.mcp.json` أو `config.toml` لـ Claude أو Codex أو Cursor أو بيئة تشغيل مخصصة.

{ "mcpServers": { "otterloop": {
    "command": "python", "args": ["-m", "otterloop.mcp_server"],
    "env": { "OTTERLOOP_API_URL": "https://dev-api.seaotter.ai",
             "OTTERLOOP_API_KEY": "sk-otter-...",
             "OTTERLOOP_POLICY_ID": "acme-prod-acceptance" } } } }

curl

أي بيئة تشغيل تتحدث HTTP يمكنها التقييم مرة واحدة أو البقاء في الحلقة.

curl -s https://dev-api.seaotter.ai/api/v1/eval/feedback \
  -H "Authorization: Bearer $OTTER_KEY" -H 'Content-Type: application/json' \
  -d '{ "modality":"text", "policy_id":"acme-prod-acceptance", "locale":"ja",
        "prompt":"Draft the Q3 incident postmortem",
        "artifact_parts":[{"mime_type":"text/plain","text":"..."}],
        "return_feedback_artifacts": true }'

Python SDK

نداء حلقة واحد يقود الإنتاج → التقييم → المراجعة حتى يقول الناقد «اشحن».

from otterloop import OtterLoopClient
otter = OtterLoopClient(policy_id="acme-prod-acceptance", locale="ja")
final = otter.loop(produce=lambda feedback: my_agent.revise(feedback), work=my_agent.first_draft(), modality="document", references=["file://brand-guide.pdf", "file://gold-postmortem.md"], max_rounds=5, target_band="ship")

الوكلاء الأذكياء يُنتجون عملاًأسرع من أي أحدٍيمكنه مراجعته.

كانت المراجعة البشرية هي الحلقة. على نطاق الوكلاء الأذكياء، تصبح عنق الزجاجة.

نموذج ناقد عدائي يقرأ العمل — ويقرر.

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.تثبّت SeaOtter المدى الدقيق وتسمّي الملف.

F1 للتوطين — هل يُثبّت العيب؟

أرسل عملاً واحصل على تقييم — متزامن أو غير متزامن.

البشر — أعد التوجيه أو الصق

الوكلاء — API وMCP

أرسل وانتظر الحكم

أرسل، ثم احصل على معرّف مهمة، واجمع النتيجة لاحقاً

صلْ وكيلك الذكي بالناقد العدائي خلال 60 ثانية.

تسجيل

أضف خادم MCP

قيِّم وكرّر

أحادي أو وكيلي. أنت تختار العمق.

ادفع مقابل العمل المُنجَز.

ضع الناقد في حلقة كل وكيل ذكي.

إنتاج

تقييم

قراءة التغذية الراجعة

مراجعة

إطلاق

الوكلاء الأذكياء يُنتجون عملاًأسرع من أي أحدٍيمكنه مراجعته.

كانت المراجعة البشرية هي الحلقة. على نطاق الوكلاء الأذكياء، تصبح عنق الزجاجة.

نموذج ناقد عدائي يقرأ العمل — ويقرر.

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.تثبّت SeaOtter المدى الدقيق وتسمّي الملف.

F1 للتوطين — هل يُثبّت العيب؟

أرسل عملاً واحصل على تقييم — متزامن أو غير متزامن.

البشر — أعد التوجيه أو الصق

الوكلاء — API وMCP

أرسل وانتظر الحكم

أرسل، ثم احصل على معرّف مهمة، واجمع النتيجة لاحقاً

صلْ وكيلك الذكي بالناقد العدائي خلال 60 ثانية.

تسجيل

أضف خادم MCP

قيِّم وكرّر

أحادي أو وكيلي. أنت تختار العمق.

ادفع مقابل العمل المُنجَز.

ضع الناقد في حلقة كل وكيل ذكي.

إنتاج

تقييم

قراءة التغذية الراجعة

مراجعة

إطلاق

الوكلاء الأذكياء يُنتجون عملاً
أسرع من أي أحدٍ
يمكنه مراجعته.

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.
تثبّت SeaOtter المدى الدقيق وتسمّي الملف.

الوكلاء الأذكياء يُنتجون عملاً
أسرع من أي أحدٍ
يمكنه مراجعته.

عيب لا يمكنك تحديد موضعه هو عيب لا يمكنك إصلاحه.
تثبّت SeaOtter المدى الدقيق وتسمّي الملف.