المواصفات جنباً إلى جنب
| البُعد | GPT-5 | Claude Opus 4.8 |
|---|---|---|
| المزوّد | OpenAI | Anthropic |
| تاريخ الإصدار | 7 أغسطس 2025 | 28 مايو 2026 |
| الإدخال / 1M | $1.25 | $5.00 |
| الإخراج / 1M | $10.00 | $25.00 |
| الإدخال المخزَّن / 1M | — | $0.50 (خصم 90%) |
| سعة السياق | 400,000 توكن | 1,000,000 توكن |
| أقصى إخراج | 128,000 توكن | 128,000 توكن |
| SWE-bench Verified | 74.9% | 88.6% |
| GPQA Diamond | غير منشور | 93.6% |
| الوضع السريع | لا | نعم — $10/$50، سرعة ~2.5× |
فجوة السعر بأرقام حقيقية
عند 10 ملايين توكن إدخال في الشهر — حِمل عمل وكيلي متوسط — تنفق $12.50 على GPT-5 أو $50 على Opus 4.8. هذا الفارق البالغ $37.50/شهر يساوي $450/سنة. وعلى نطاق إنتاج قدره 500M توكن إدخال شهرياً، يصبح $7,500 مقابل $30,000.
الكاش لدى Opus يقلب الحساب. تخزّن Claude برومبتات النظام بسعر $0.50/1M — خصم 90%. إذا أرسل وكيلك سياقاً بحجم 40,000 توكن في كل استدعاء، تنخفض كلفة الإدخال العملية لكل استدعاء انخفاضاً حاداً بمجرد أن يسخن الكاش. وليس لدى GPT-5 خصم كاش منشور. لأحمال العمل الوكيلية ذات برومبتات النظام الكبيرة الثابتة، يمكن أن تكون كلفة Opus الشهرية الإجمالية أقرب إلى كلفة GPT-5 مما توحي به أسعار التوكن المعلنة. حاكِ أنماط استدعائك الفعلية قبل أن تفترض أن GPT-5 أرخص.
ماذا تعني فعلاً فجوة البرمجة البالغة 14 نقطة
يقدّم SWE-bench Verified مشكلات GitHub حقيقية من مستودعات Python مفتوحة المصدر. على النموذج أن يقرأ المشكلة، ويفهم الشيفرة، ويكتب إصلاحاً، ويجتاز الاختبارات الموجودة — بلا سقالات ولا تلميحات. عند 88.6%، يحلّ Opus نحو 88 من كل 100 مشكلة دون تدخّل بشري. ويحلّ GPT-5 نحو 75.
تهمّ تلك الفجوة أكثر ما تهمّ حين يكون البشر خارج الحلقة. إذا كنت تشغّل بوت CI يطبّق الرُقع المولَّدة من النموذج ذاتياً، فإن تلك الإخفاقات الـ 13 الإضافية لكل 100 مشكلة تترجم مباشرةً إلى بِنى معطوبة أو تنظيف يدوي. عند 200 PR آلي يومياً، يعني ذلك 26 إخفاقاً إضافياً يستدعي انتباه مهندس. وبسعر $30 لساعة المهندس، يتحرّك الحساب بسرعة.
خارج إصلاح الشيفرة المؤتمت بالكامل، تضيق الفجوة كثيراً. كتابة دوال من مواصفات، صياغة docstrings، شرح شيفرة غير مألوفة — يتعامل GPT-5 مع كل هذه جيداً بما يكفي ألّا تلاحظ معظم الفِرق الفرق. العلاوة مقابل إخراج البشر من الحلقة، لا مساعدتهم.
سعة السياق: حين لا يكفي 400K
لمعظم أحمال عمل الإنتاج، يكفي سياق GPT-5 البالغ 400K توكن. وحيث يَعَضّ: قواعد شيفرة كاملة، عقود قانونية طويلة، ذاكرة وكيل عبر جلسات متعددة، أو مهام تحليل مستندات تريد أن تُدخِل كل شيء دفعة واحدة. يتعامل سياق Opus 4.8 البالغ 1M توكن مع كل هذه دون اقتطاع. إذا كانت حالة استخدامك تقترب بانتظام من 300K توكن، فهذا قيد وظيفي، لا مجرّد مقارنة مواصفات.