هذا هو قرار النموذج اليومي الذي يواجهه معظم الفِرق في 2026. ليس أيٌّ من النموذجين هو النموذج المتقدّم في مختبره — فـ Opus 4.8 وGPT-5.5 يقفان فوقهما — لكن هذين النموذجين يحملان جُلّ حركة الإنتاج الحقيقية لأنهما الطبقتان المسعّرتان للحجم الكبير. بُنيا بوصفتين مختلفتين، وورقة الأسعار لا تروي سوى نصف الحكاية.
المواصفات جنباً إلى جنب
| البُعد | Claude Sonnet 4.6 | GPT-5 |
|---|---|---|
| الإدخال / 1M | $3.00 | $1.25 |
| الإخراج / 1M | $15.00 | $10.00 |
| الإدخال المخزَّن / 1M | $0.30 | — |
| سعة السياق | 1,000,000 | 400,000 |
| أقصى إخراج | 64,000 | 128,000 |
| SWE-bench Verified | 79.6% | 74.9% |
| الإنتاجية (تقدير benchr) | 95 tok/s | 90 tok/s |
فجوة السعر تنكمش حين تستخدم الكاش
العنوان يقول إن Sonnet يكلّف أكثر بـ 2.4× على الإدخال. والهامش يقول إن لدى Sonnet طبقة إدخال مخزَّن بسعر $0.30 وليس لدى GPT-5 سعر مخزَّن في سجل benchr المُتحقَّق منه. لوكيل ببرومبت نظام بحجم 40K توكن يُستدعى آلاف المرات يومياً، يقلب ذلك الترتيب: يُحتسب البرومبت المتكرر بسعر $0.30/1M على Sonnet، أي أقل من رُبع سعر GPT-5 القياسي البالغ $1.25. أما أحمال العمل عديمة الحالة قصيرة البرومبت فلا ترى هذه الفائدة أبداً — وهذا بالضبط سبب اختلاف الجواب الصحيح من فريق إلى آخر. مرِّر مزيجك الخاص عبر حاسبة التكلفة.
حِمل عمل ملموس
خذ بوت مراجعة شيفرة: 15K توكن إدخال (الفرق + السياق)، 3K إخراج، 20,000 تشغيلة في الشهر. على GPT-5 يساوي ذلك $375 إدخال + $600 إخراج = $975/شهر. وعلى Sonnet 4.6 من دون كاش: $900 + $900 = $1,800/شهر. وإذا كانت 10K من توكنات الإدخال تلك بادئةً مخزَّنة ثابتة، ينزل Sonnet إلى نحو $1,260/شهر. أنت تدفع بضع مئات من الدولارات شهرياً مقابل أفضلية 4.7 نقطة على SWE-bench — وهي رخيصة إذا وفّرت عليك ولو خطأً واحداً فائتاً في الأسبوع، وبلا جدوى إذا كانت مراجعاتك مجرّد فحوص أسلوب بسيطة.
أين يكسب كلٌّ منهما
يكسب Sonnet 4.6 في البرمجة على مستوى المستودع، وفي أي شيء يحتاج أكثر من 400K توكن في نافذة واحدة، وفي الوكلاء كثيري البرومبت الذين يستثمرون الكاش. إنه النموذج الذي تسمّيه مراجعة benchr طبقة النموذج اليومي لسبب وجيه. أما GPT-5 فيكسب في السعر الخام للمهام القصيرة، وفي سقف الإخراج (128K مقابل 64K أقصى إخراج)، وحين تكون منظومتك مبنيةً أصلاً على أشكال API الخاصة بـ OpenAI. السبب الخاطئ لاختيار أيٍّ منهما هو الولاء للعلامة — والسبب الصحيح هو مزيج توكناتك.