قبل ثلاثة أسابيع، كانت بنية Anthropic من فئة Mythos تعيش في مكان واحد بالضبط: Claude Fable 5، بسعر $10 لكل مليون رمز إدخال و$50 للإخراج لأصعب أعمال البرمجة الوكيلية. والسؤال المفتوح كان هل ستنزل تلك البنية يوماً في السعر، أم تبقى ترفاً حصرياً على النموذج الرائد. في 1 يوليو، أجابت Anthropic. يعمل Claude Sonnet 5 على بنية فئة Mythos نفسها، ويستقر في منتصف تشكيلة Claude بسعر $4 لكل مليون رمز إدخال و$20 للإخراج — ليس "Sonnet 4.7" جديداً، بل نموذجاً ثانياً مبنياً على أساس Fable 5.
بنية واحدة، طبقتان
يقع Sonnet 5 بين $3/$15 لـ Sonnet 4.6 و$5/$25 لـ Opus 4.8، بسعر $4 لكل مليون رمز إدخال و$20 للإخراج. الإدخال المخزّن مؤقتاً يكلف $0.40 لكل مليون، وواجهة الدفعات (Batch) تخصم 50% من الاتجاهين لتصل إلى $2/$10 — نفس قاعدة الخصم المعتمدة في بقية خط Claude. يبقى السياق عند مليون رمز، مطابقاً لـ Sonnet 4.6 وOpus 4.8، لكن حد الإخراج يقفز إلى 200,000 رمز، أكثر من ثلاثة أضعاف الـ64,000 لـ Sonnet 4.6 وأعلى بكثير من الـ128,000 لـ Opus 4.8. معرّف الـAPI هو claude-sonnet-5، وحدّ التقاعد المبدئي الذي تضعه Anthropic ليس قبل 1 يوليو 2027 — نفس قاعدة السنة الواحدة التي تطبّقها على بقية نماذجها النشطة.
تجلب البنية سمتين موروثتين إضافيتين. التفكير التكيفي مفعّل دائماً، بلا مفتاح تفكير موسّع يمكن قلبه — نفس السلوك الذي دشّنه Fable 5. وتنطبق مصنفات الأمان نفسها: الطلبات التي تلامس الأمن السيبراني الهجومي، ومعظم الأحياء والكيمياء، أو محاولات تقطير قدرات النموذج، تعود إلى Claude Opus 4.8، مطابقةً لكيفية تعامل Fable 5 مع هذه الفئات.
ماذا تقول المعايير
الرقم الأبرز هو SWE-bench Verified: يسجل Sonnet 5 نسبة 89.4%، متقدماً على 88.6% لـ Claude Opus 4.8 — نموذج من الطبقة الوسطى يتفوق على النموذج الرائد الذي أُطلق الشهر الماضي في معيار يُتابَع عن كثب. أما SWE-bench Pro، اختبار البرمجة الوكيلية الأصعب، فيسجل 71.8%. ويصل Terminal-Bench 2.1 إلى 85.6%. أما التفكير فقصته مختلفة: GPQA Diamond يسجل 92.0%، متأخراً عن 93.6% لـ Opus 4.8، لذا يحتفظ Opus 4.8 بالتفوق في التفكير العلمي بمستوى الدراسات العليا. وعلى ARC-AGI-2، يسجل Sonnet 5 نسبة 20.0، متقدماً على 15.0 لـ Sonnet 4.6. ويسجل اختبار Humanity's Last Exam بلا أدوات نسبة 42.5%. وبقية الجدول: LMSYS Arena 1435، MMLU 93.8%، HumanEval 96.0%، MATH 93.5%.
اقرأ النمط بصدق: يغلق Sonnet 5 تقريباً كل فجوة البرمجة إلى Opus 4.8، بل يتجاوزه فعلياً على SWE-bench Verified، بينما يتنازل عن أرضية في معيار التفكير الأصعب. تلك مقايضة منطقية لنموذج يُسعَّر عند 80% من سعر إدخال Opus 4.8.
Sonnet 5 مقابل Sonnet 4.6 مقابل Opus 4.8
| المواصفة | Claude Sonnet 5 | Claude Sonnet 4.6 | Claude Opus 4.8 |
|---|---|---|---|
| السعر (إدخال/إخراج لكل مليون) | $4 / $20 | $3 / $15 | $5 / $25 |
| نافذة السياق | 1M رمز | 1M رمز | 1M رمز |
| حد الإخراج | 200K | 64K | 128K |
| SWE-bench Verified | 89.4% | 79.6% | 88.6% |
| GPQA Diamond | 92.0% | 89.9% | 93.6% |
| وضع التفكير | تكيفي، مفعّل دائماً | قياسي | قياسي |
| القيود | السيبراني / الأحياء / التقطير تعود إلى Opus 4.8 | قياسية | قياسية |
هل تستحق ترقية الطبقة الوسطى؟
احسب على عبء عمل حقيقي قبل التبديل. وكيل برمجة يحرق 2M رمز إدخال و400K رمز إخراج يومياً يكلف نحو $16 على Sonnet 5 (2 × $4 + 0.4 × $20)، مقابل $12 على Sonnet 4.6 (2 × $3 + 0.4 × $15) و$20 على Opus 4.8 (2 × $5 + 0.4 × $25). هذا يضع فاتورة Sonnet 5 أعلى بنحو الثلث من فاتورة Sonnet 4.6، وأقل بـ20% من فاتورة Opus 4.8، لنموذج يتفوق على Opus 4.8 في SWE-bench Verified. حاسبة التكلفة تفعلها لأحجامك الخاصة، وتفصيل أسعار Claude Sonnet 5 يغطي حسابات التخزين المؤقت والدفعات بالكامل.
حيث تستحق الترقية بوضوح: وكلاء البرمجة وحلقات الأدوات الطويلة التي كانت تصطدم بسقف الـ64K إخراج لدى Sonnet 4.6، لأن حد الإخراج 200K يعني ردوداً مبتورة أقل بكثير في منتصف المهمة. وحيث يصعب تبرير الترقية: أعباء العمل المرتاحة أصلاً على Sonnet 4.6 والتي لا تحتاج هامش الإخراج الإضافي أو قفزة البرمجة — زيادة السعر بنسبة 33% ليست مجانية. وإذا كان عملك يعتمد على سقف تفكير Opus 4.8 بمستوى GPQA، فإن Sonnet 5 لا يغلق تلك الفجوة؛ يبقى Opus 4.8 الخيار.
أسبوع إطلاق مزدحم
لم يصدر Sonnet 5 في عزلة. في اليوم نفسه، أُغلقت مراجعة ضوابط التصدير لدى Anthropic وأُعيد Claude Fable 5 لجميع العملاء، مع استعادة AWS الوصول على Bedrock في الوقت نفسه — تصف Anthropic الخطوتين بأنهما نتيجة المراجعة نفسها وهي تُغلَق بنظافة. وهو أيضاً الأسبوع الذي غادر فيه GPT-5.6 من OpenAI معاينته المحصورة بالشركاء إلى الإتاحة العامة، وأطلقت فيه Google Gemini 3.5 Pro بنافذة سياق مليوني رمز. لا شيء من هذا يغيّر حسابات Sonnet 5 مباشرة، لكنه الخلفية: ثلاثة مختبرات حرّكت خطوط أسعارها وقدراتها في الأسبوع نفسه، وأداة مقارنة النماذج من benchr أسرع طريقة لرؤية كيف استقرت التشكيلة الحالية.