مقارنة مباشرة: للتفصيل حالة بحالة لِما يشتريه الدولار الإضافي مقارنة بـSonnet 4.6، وأين يظلّ Opus 4.8 متفوّقًا، راجع الأقسام أدناه. وتغطية الإطلاق تقدّم الصورة الأكمل للقدرات.
تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $4.00 |
| إخراج قياسي | $20.00 |
| إدخال مخزّن | $0.40 |
| الدُّفعات (خصم 50%) | $2.00 / $10.00 |
| سعة السياق | 1,000,000 توكن |
| أقصى إخراج | 200,000 توكن |
طبقة سعر جديدة، لا رقم جديد بعد «Sonnet»
Claude Sonnet 5 هو ثاني نموذج تبنيه أنثروبيك على بنية Mythos التي قدّمتها مع Claude Fable 5 في 9 يونيو. وبدل تسميته «Sonnet 4.7» أو «4.8»، أنزلت أنثروبيك البنية الجديدة إلى طبقة سعر متوسطة: 4$ للمليون إدخال و20$ للإخراج، لتحطّ بين سعر Sonnet 4.6 البالغ 3$/15$ وسعر Opus 4.8 البالغ 5$/25$. الإدخال المخزّن يكلّف 0.40$ للمليون، وواجهة الدُّفعات تخفّض السعرين إلى النصف فتصبحان 2$/10$ — نفس عرف خصم الدُّفعات بنسبة 50% المعتمد في بقية سلسلة Claude.
التفوّق على رائد الشهر الماضي في رقم واحد
يسجّل Claude Sonnet 5 89.4% على SWE-bench Verified، متجاوزًا نتيجة Claude Opus 4.8 البالغة 88.6% — نموذج متوسط الطبقة يتفوّق على رائد الشهر الماضي في البنشمارك الأدقّ تنبؤًا بنجاح وكلاء البرمجة في الواقع. كما يسجّل 71.8% على SWE-bench Pro، و85.6% على Terminal-Bench 2.1، و96.0% على HumanEval، و93.5% على MATH. الموضع الوحيد الذي يحتفظ فيه Opus 4.8 بتقدّمه هو GPQA Diamond: 93.6% مقابل 92.0% لـ Sonnet 5. فإن كان حِملك يهيمن عليه استدلال علمي بمستوى الدراسات العليا أكثر من البرمجة، فهذه الفجوة البالغة 1.6 نقطة هي سبب البقاء على Opus.
وبقيّة البطاقة: 1435 على LMSYS Arena، و93.8% على MMLU، و20.0 على ARC-AGI-2، و42.5% على Humanity's Last Exam بلا أدوات — ملف عام قوي لنموذج مُسعَّر أقل من الرائد.
أقصى إخراج 200 ألف: الميزة العملية الأبرز
يدعم Claude Sonnet 5 200,000 توكن إخراج لكل استجابة — أكثر من ثلاثة أضعاف سقف Sonnet 4.6 البالغ 64,000 توكن. في الأحمال التي تولّد مستندات طويلة، أو فروقات (diffs) كبيرة، أو تعديلات كود متعدّدة الملفات في نداء واحد، يزيل هذا قيدًا حقيقيًا: المهام التي كانت تتطلّب تقسيم الاستجابة على عدّة نداءات لـ Sonnet 4.6 تتّسع الآن في نداء واحد لـ Sonnet 5، مع سياق كامل يبلغ 1,000,000 توكن متاح للقراءة منه.
التفكير التكيّفي، ونفس مسار الأمان الاحتياطي في Fable 5
مثل Fable 5، يرث Claude Sonnet 5 التفكير التكيّفي في بنية Mythos: يقرّر النموذج بنفسه عمق الاستدلال لكل طلب، ولا يوجد مفتاح تفكير موسّع يدوي لضبطه. كما يرث سلوك مصنّف الأمان نفسه — فطلبات الأمن السيبراني الهجومي، ومعظم أسئلة الأحياء والكيمياء، ومحاولات التقطير تُوجَّه تلقائيًا إلى Claude Opus 4.8 بدل الإجابة عنها مباشرة. ضع ميزانيتك على سعر Sonnet 5، وعامِل أي حالة تنتقل إلى تسعير Opus 4.8 على أنّها الاستثناء لا القاعدة.
سيناريوهات التكلفة
جلسة بمليون توكن (800 ألف إدخال، و200 ألف إخراج — نداء واحد يستخدم كامل سقف أقصى إخراج): 800,000/مليون × 4$ + 200,000/مليون × 20$ = 3.20$ + 4.00$ = 7.20$. ووجّه الجلسة نفسها عبر واجهة الدُّفعات فتهبط إلى 1.60$ + 2.00$ = 3.60$، أي النصف بالضبط.
أضِف التخزين: إن غطّى برومبت نظام ثابت أو لقطة مستودع 720 ألفًا من إجمالي 800 ألف إدخال (نجاح تخزين 90%)، يصبح طرف الإدخال 720,000/مليون × 0.40$ + 80,000/مليون × 4$ = 0.288$ + 0.32$ = 0.608$، ليصبح إجمالي الجلسة 0.608$ + 4.00$ = 4.61$ — انخفاض بنسبة 36% عن 7.20$ غير المخزّنة.
يوم استخدام نموذجي: فريق وكيل برمجة يشغّل 25 جلسة من هذه الجلسات بمليون توكن يوميًا يدفع 25 × 7.20$ = 180$/يوم بلا تخزين، أو 25 × 3.60$ = 90$/يوم عبر الدُّفعات. وعلى مقياس شهري أصغر — 20 مليون إدخال و5 مليون إخراج، وهو الحجم نفسه المستخدَم لمقارنة Sonnet 4.6 وOpus 4.8 — تكلفة Sonnet 5 هي 20 × 4$ + 5 × 20$ = 80$ + 100$ = 180$/شهر. وSonnet 4.6 عند هذا الحجم 60$ + 75$ = 135$/شهر؛ وOpus 4.8 هو 100$ + 125$ = 225$/شهر. ثلاث طبقات، وتدرّج خطي واضح واحد في السعر والقدرة معًا.
ملاءمة الاستخدام
الأفضل لـ: مستخدمي Sonnet 4.6 الذين يريدون قفزة قدرة حقيقية دون دفع سعر Opus؛ خطوط وكلاء البرمجة التي تستفيد من سقف أقصى إخراج 200 ألف؛ الفِرق التي يهيمن على حملها العمل البرمجي، حيث تتفوّق نتيجة Sonnet 5 في SWE-bench Verified الآن على Opus 4.8.
تجاوزه إن: اعتمد حِملك على مهام استدلال علمي بمستوى الدراسات العليا — إذ ما زال Opus 4.8 متقدّمًا على GPQA Diamond بفارق 1.6 نقطة؛ أو احتجت أقصى سقف استدلال بصرف النظر عن السعر؛ أو كانت حركتك عالية الحجم وروتينية، حيث يبقى Sonnet 4.6 الافتراضي الأرخص.
قائمة القرار
قادمًا من Sonnet 4.6: شغّل أصعب تقييم مهام برمجة لديك على النموذجين معًا. إن ظهرت مكاسب Sonnet 5 على مستوى SWE-bench في نتائجك، فمن السهل تبرير زيادة السعر 33% استنادًا فقط إلى سقف الإخراج 200 ألف.
بالمقارنة مع Opus 4.8: إن كانت مهامّك ذات طابع برمجي غالب، فـ Sonnet 5 أرخص وأعلى نتيجة على SWE-bench Verified معًا. وإن كانت ثقيلة الاستدلال بمعنى GPQA، فإنّ نتيجة Opus 4.8 البالغة 93.6% ما زالت تشتري شيئًا لا يضاهيه Sonnet 5.