وجهًا لوجه: كيف تقف بطاقة الأسعار هذه أمام نموذج OpenAI اليومي مشروحٌ في مقارنة ChatGPT وClaude وGemini، وأمام منافس الأوزان المفتوحة في DeepSeek مقابل OpenAI في التسعير.
تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $3.00 |
| إخراج قياسي | $15.00 |
| إدخال مخزّن | $0.30 |
| سعة السياق | 200,000 توكن |
| أقصى إخراج | 64,000 توكن |
لماذا Sonnet هو الافتراضي لا Opus
معظم حركة النماذج في الإنتاج لا تتطلّب استدلالًا في الطبقة المتقدّمة. يتولّى Sonnet 4.6 المهام الحوارية وتلخيص المستندات ومراجعة الكود وتوليد الكود متوسّط التعقيد والتصنيف عند 79.6% على SWE-bench — وهي نتيجة قوية بما يكفي للغالبية العظمى من حالات الاستخدام الواقعية. فجوة التسع نقاط نحو Opus 4.8 تهمّ تحديدًا حين تتطلّب المهمّة استدلالًا متعدّد الخطوات فوق قواعد كود معقّدة، حيث تتراكم الأخطاء ويُبلَغ سقف الجودة فعلًا.
تضع أنثروبيك Sonnet كافتراضي إنتاجي لهذا السبب. واقتصاد الكلفة يرجّح أن يكون Sonnet هو الأصل، وأن تكون الترقية فقط حيث تُظهر بيانات التقييم تفوّق Opus في نتائج المهام — لا كترقية شاملة.
ميزة الإخراج 64 ألف توكن
يدعم Claude Sonnet 4.6 64,000 توكن إخراج في الاستجابة الواحدة — ضعف حدّ Opus البالغ 32 ألفًا. في الأحمال ثقيلة الإخراج — توليد توثيق كامل، أو إنتاج ملفّات كود كبيرة، أو كتابة تقارير مطوّلة — يكون Sonnet 4.6 أنسب من Opus بصرف النظر عن عمق الاستدلال. إخراج بحجم 64 ألفًا بسعر Sonnet (15$ للمليون) يكلّف 0.96$ للنداء؛ والمثيل بسعر Opus 4.8 (25$ للمليون) سيكلّف 1.60$ وسيستلزم تقسيمه إلى نداءين.
التخزين والأسعار الفعلية
إدخال Claude Sonnet 4.6 المخزّن يكلّف 0.30$ للمليون — خصم 90% عن السعر القياسي 3$. لوكيل نمطي ببرومبت نظام بحجم 50 ألف توكن يشغّل 1,000 نداء يوميًا، يوفّر التخزين نحو 135$ يوميًا مقابل غير المخزّن عند 3$ للمليون. ومع معدّلات إصابة تخزين عالية، تنخفض كلفة الإدخال الفعلية إلى نحو 0.57$ للمليون — منافِسة لسعر Haiku غير المخزّن في الأحمال ثقيلة الإدخال.
سيناريوهات التكلفة
عند 20 مليون إدخال + 5 ملايين إخراج شهريًا: 60$ + 75$ = 135$ شهريًا. وOpus 4.8 عند نفس الحجم: 100$ + 125$ = 225$ شهريًا — أي 90$ زيادة مقابل علاوة Opus. ومع معدّل إصابة تخزين 90% على Sonnet 4.6: نحو 11.40$ + 75$ = 86.40$ شهريًا. لشركة ناشئة تعالج استفسارات العملاء، هذا فرق ميزانية شهري عملي يتراكم مع التوسّع.
ملاءمة الاستخدام
الأفضل لـ: تطبيقات المحادثة والمساعد الإنتاجية؛ مراجعة الكود والتوليد متوسّط التعقيد؛ تلخيص المستندات الطويلة (حتى سياق 200 ألف)؛ الخطوط التي يكون فيها طول الإخراج 64 ألفًا ميزة؛ النشر الحسّاس للكلفة حيث لا يُشترط أداء الطبقة المتقدّمة.
تجاوزه إن: تطلّبت مهامك برمجة متعدّدة الخطوات في الطبقة المتقدّمة (استخدم Opus 4.8)؛ أو احتجت أقصى إنتاجية في المهام البسيطة بأدنى كلفة (استخدم Haiku 4.5 عند 1$ للمليون).
قائمة القرار
قبل استخدام Opus 4.8 بدلًا منه: شغّل تقييمًا من 50 عيّنة لأصعب فئة مهامّ لديك على كلٍّ من Sonnet 4.6 وOpus 4.8. إن لم تستطع رصد فرق جودة فابقَ على Sonnet — فخفض الكلفة بنسبة 40% يتراكم بقوّة عند حجم الإنتاج.
قبل استخدام Haiku 4.5 بدلًا منه: تأكّد أنّ مهامك لا تتطلّب استدلالًا متواصلًا. نتيجة Haiku البالغة 73.3% على SWE-bench هي تراجع بـ 6 نقاط عن 79.6% لـ Sonnet، وهو فرق قابل للقياس في مهام البرمجة والتحليل حتى وإن غاب في التصنيف البسيط.