دليل التسعير·يوليو 2026

تسعير Claude Sonnet 5: تكلفة كل مليون توكن وسيناريوهات التكلفة

Q: هل يتفوّق Claude Sonnet 5 فعلًا على Opus 4.8 في البنشماركات؟

نعم، في بنشمارك واحد مهمّ. يسجّل Claude Sonnet 5 89.4% على SWE-bench Verified مقابل 88.6% لـ Opus 4.8 — نموذج متوسط الطبقة يتفوّق على رائد الشهر الماضي في البرمجة. لكنّ Opus 4.8 ما زال متقدّمًا على GPQA Diamond بـ93.6% مقابل 92.0% لـ Sonnet 5، فيبقى Opus 4.8 الخيار الأنسب لأصعب مهام الاستدلال.

Claude Sonnet 5 هو ثاني نموذج من فئة Mythos لدى أنثروبيك، وأوّل من يحطّ عند سعر متوسط الطبقة: 4$ للمليون إدخال و20$ للإخراج — بين Sonnet 4.6 وOpus 4.8 تمامًا. يسجّل 89.4% على SWE-bench Verified، متجاوزًا نتيجة Opus 4.8 البالغة 88.6%، مع حدّ أقصى للإخراج يبلغ 200 ألف توكن — أكثر من ثلاثة أضعاف حدّ Sonnet 4.6.

من فريق benchr · نُشر في 1 يوليو 2026 · الأرقام محقّقة مقابل المصادر الرسمية، 1 يوليو 2026 · عرض سجل التغييرات

الإدخال / مليونأنثروبيك · يوليو 2026

الإخراج / مليونأنثروبيك

SWE-benchمُحقّقة

السياقأقصى إخراج 200K

مقارنة مباشرة: للتفصيل حالة بحالة لِما يشتريه الدولار الإضافي مقارنة بـSonnet 4.6، وأين يظلّ Opus 4.8 متفوّقًا، راجع الأقسام أدناه. وتغطية الإطلاق تقدّم الصورة الأكمل للقدرات.

تفصيل التسعير

claude-sonnet-5 — التسعير الرسمي من أنثروبيك، 1 يوليو 2026
الطبقة	السعر / مليون توكن
إدخال قياسي	$4.00
إخراج قياسي	$20.00
إدخال مخزّن	$0.40
الدُّفعات (خصم 50%)	$2.00 / $10.00
سعة السياق	1,000,000 توكن
أقصى إخراج	200,000 توكن

طبقة سعر جديدة، لا رقم جديد بعد «Sonnet»

Claude Sonnet 5 هو ثاني نموذج تبنيه أنثروبيك على بنية Mythos التي قدّمتها مع Claude Fable 5 في 9 يونيو. وبدل تسميته «Sonnet 4.7» أو «4.8»، أنزلت أنثروبيك البنية الجديدة إلى طبقة سعر متوسطة: 4$ للمليون إدخال و20$ للإخراج، لتحطّ بين سعر Sonnet 4.6 البالغ 3$/15$ وسعر Opus 4.8 البالغ 5$/25$. الإدخال المخزّن يكلّف 0.40$ للمليون، وواجهة الدُّفعات تخفّض السعرين إلى النصف فتصبحان 2$/10$ — نفس عرف خصم الدُّفعات بنسبة 50% المعتمد في بقية سلسلة Claude.

التفوّق على رائد الشهر الماضي في رقم واحد

يسجّل Claude Sonnet 5 ‏89.4% على SWE-bench Verified، متجاوزًا نتيجة Claude Opus 4.8 البالغة 88.6% — نموذج متوسط الطبقة يتفوّق على رائد الشهر الماضي في البنشمارك الأدقّ تنبؤًا بنجاح وكلاء البرمجة في الواقع. كما يسجّل 71.8% على SWE-bench Pro، و85.6% على Terminal-Bench 2.1، و96.0% على HumanEval، و93.5% على MATH. الموضع الوحيد الذي يحتفظ فيه Opus 4.8 بتقدّمه هو GPQA Diamond: ‏93.6% مقابل 92.0% لـ Sonnet 5. فإن كان حِملك يهيمن عليه استدلال علمي بمستوى الدراسات العليا أكثر من البرمجة، فهذه الفجوة البالغة 1.6 نقطة هي سبب البقاء على Opus.

وبقيّة البطاقة: 1435 على LMSYS Arena، و93.8% على MMLU، و20.0 على ARC-AGI-2، و42.5% على Humanity's Last Exam بلا أدوات — ملف عام قوي لنموذج مُسعَّر أقل من الرائد.

أقصى إخراج 200 ألف: الميزة العملية الأبرز

يدعم Claude Sonnet 5 ‏200,000 توكن إخراج لكل استجابة — أكثر من ثلاثة أضعاف سقف Sonnet 4.6 البالغ 64,000 توكن. في الأحمال التي تولّد مستندات طويلة، أو فروقات (diffs) كبيرة، أو تعديلات كود متعدّدة الملفات في نداء واحد، يزيل هذا قيدًا حقيقيًا: المهام التي كانت تتطلّب تقسيم الاستجابة على عدّة نداءات لـ Sonnet 4.6 تتّسع الآن في نداء واحد لـ Sonnet 5، مع سياق كامل يبلغ 1,000,000 توكن متاح للقراءة منه.

التفكير التكيّفي، ونفس مسار الأمان الاحتياطي في Fable 5

مثل Fable 5، يرث Claude Sonnet 5 التفكير التكيّفي في بنية Mythos: يقرّر النموذج بنفسه عمق الاستدلال لكل طلب، ولا يوجد مفتاح تفكير موسّع يدوي لضبطه. كما يرث سلوك مصنّف الأمان نفسه — فطلبات الأمن السيبراني الهجومي، ومعظم أسئلة الأحياء والكيمياء، ومحاولات التقطير تُوجَّه تلقائيًا إلى Claude Opus 4.8 بدل الإجابة عنها مباشرة. ضع ميزانيتك على سعر Sonnet 5، وعامِل أي حالة تنتقل إلى تسعير Opus 4.8 على أنّها الاستثناء لا القاعدة.

سيناريوهات التكلفة

جلسة بمليون توكن ‏(800 ألف إدخال، و200 ألف إخراج — نداء واحد يستخدم كامل سقف أقصى إخراج): 800,000/مليون × 4$ + 200,000/مليون × 20$ = 3.20$ + 4.00$ = 7.20$. ووجّه الجلسة نفسها عبر واجهة الدُّفعات فتهبط إلى 1.60$ + 2.00$ = 3.60$، أي النصف بالضبط.

أضِف التخزين: إن غطّى برومبت نظام ثابت أو لقطة مستودع 720 ألفًا من إجمالي 800 ألف إدخال (نجاح تخزين 90%)، يصبح طرف الإدخال 720,000/مليون × 0.40$ + 80,000/مليون × 4$ = 0.288$ + 0.32$ = 0.608$، ليصبح إجمالي الجلسة 0.608$ + 4.00$ = 4.61$ — انخفاض بنسبة 36% عن 7.20$ غير المخزّنة.

يوم استخدام نموذجي: فريق وكيل برمجة يشغّل 25 جلسة من هذه الجلسات بمليون توكن يوميًا يدفع 25 × 7.20$ = 180$/يوم بلا تخزين، أو 25 × 3.60$ = 90$/يوم عبر الدُّفعات. وعلى مقياس شهري أصغر — 20 مليون إدخال و5 مليون إخراج، وهو الحجم نفسه المستخدَم لمقارنة Sonnet 4.6 وOpus 4.8 — تكلفة Sonnet 5 هي 20 × 4$ + 5 × 20$ = 80$ + 100$ = 180$/شهر. وSonnet 4.6 عند هذا الحجم 60$ + 75$ = 135$/شهر؛ وOpus 4.8 هو 100$ + 125$ = 225$/شهر. ثلاث طبقات، وتدرّج خطي واضح واحد في السعر والقدرة معًا.

معرّف API

معرّف النموذج هو claude-sonnet-5 عبر واجهة أنثروبيك. الحدّ الأدنى المبدئي لموعد التقاعد ليس قبل 1 يوليو 2027 — نفس عرف السنة الواحدة الذي تطبّقه أنثروبيك على نماذج Claude الأخرى النشطة.

ملاءمة الاستخدام

الأفضل لـ: مستخدمي Sonnet 4.6 الذين يريدون قفزة قدرة حقيقية دون دفع سعر Opus؛ خطوط وكلاء البرمجة التي تستفيد من سقف أقصى إخراج 200 ألف؛ الفِرق التي يهيمن على حملها العمل البرمجي، حيث تتفوّق نتيجة Sonnet 5 في SWE-bench Verified الآن على Opus 4.8.

تجاوزه إن: اعتمد حِملك على مهام استدلال علمي بمستوى الدراسات العليا — إذ ما زال Opus 4.8 متقدّمًا على GPQA Diamond بفارق 1.6 نقطة؛ أو احتجت أقصى سقف استدلال بصرف النظر عن السعر؛ أو كانت حركتك عالية الحجم وروتينية، حيث يبقى Sonnet 4.6 الافتراضي الأرخص.

قائمة القرار

قادمًا من Sonnet 4.6: شغّل أصعب تقييم مهام برمجة لديك على النموذجين معًا. إن ظهرت مكاسب Sonnet 5 على مستوى SWE-bench في نتائجك، فمن السهل تبرير زيادة السعر 33% استنادًا فقط إلى سقف الإخراج 200 ألف.

بالمقارنة مع Opus 4.8: إن كانت مهامّك ذات طابع برمجي غالب، فـ Sonnet 5 أرخص وأعلى نتيجة على SWE-bench Verified معًا. وإن كانت ثقيلة الاستدلال بمعنى GPQA، فإنّ نتيجة Opus 4.8 البالغة 93.6% ما زالت تشتري شيئًا لا يضاهيه Sonnet 5.

أسئلة شائعة

كيف يقارَن تسعير Claude Sonnet 5 بـ Sonnet 4.6 وOpus 4.8؟

يقع Claude Sonnet 5 بينهما تمامًا: 4$ للمليون إدخال و20$ للإخراج، مقابل 3$/15$ لـ Sonnet 4.6 و5$/25$ لـ Opus 4.8. عند 20 مليون توكن إدخال و5 مليون إخراج شهريًا، تصبح الفاتورة 135$ على Sonnet 4.6، و180$ على Sonnet 5، و225$ على Opus 4.8 — تدرّج خطي واضح في السعر والقدرة معًا.

هل يتفوّق Claude Sonnet 5 فعلًا على Opus 4.8 في البنشماركات؟

نعم، في بنشمارك واحد مهمّ. يسجّل Claude Sonnet 5 ‏89.4% على SWE-bench Verified مقابل 88.6% لـ Opus 4.8 — نموذج متوسط الطبقة يتفوّق على رائد الشهر الماضي في البرمجة. لكنّ Opus 4.8 ما زال متقدّمًا على GPQA Diamond بـ93.6% مقابل 92.0% لـ Sonnet 5، فيبقى Opus 4.8 الخيار الأنسب لأصعب مهام الاستدلال.

ما هو التفكير التكيّفي، ولماذا لا يوجد مفتاح تفكير موسّع؟

يرث Claude Sonnet 5 بنية Mythos التي قُدّمت مع Claude Fable 5: يقرّر النموذج بنفسه عمق الاستدلال لكل طلب بدل إتاحة مفتاح تفكير موسّع يدوي. كما يرث سلوك مصنّف الأمان نفسه — فطلبات الأمن السيبراني الهجومي ومعظم أسئلة الأحياء والكيمياء ومحاولات التقطير تُحوَّل تلقائيًا إلى Claude Opus 4.8.

سجل التغييرات

1 يوليو 2026 — نُشر عند الإطلاق. أرقام التسعير والبنشماركات والسياق وأقصى إخراج محقّقة مقابل إعلان أنثروبيك ووثائق النماذج الرسمية.

المصادر

أسعار واجهة أنثروبيك — anthropic.com/pricing (محقّقة 1 يوليو 2026)
لوحة صدارة SWE-bench Verified — swebench.com (محقّقة 1 يوليو 2026)
ملف models.json من benchr — محقّق 1 يوليو 2026