Claude Sonnet 4.6 مقابل GPT-5: قرار النموذج اليومي

يكلّف Sonnet أكثر بـ 2.4× على الإدخال، ويشتري بذلك درجة برمجة أعلى، وسياق 1M، وطبقة كاش لا يملكها GPT-5.

بقلم فريق benchr · · عرض سجل التغييرات · تم التحقق من الأرقام من مصادر رسمية في 10 يونيو 2026

إدخال Sonnet 4.6 / 1MAnthropic · إخراج $15
إدخال GPT-5 / 1MOpenAI · إخراج $10
SWE-bench لـ SonnetVerified، رسمي
SWE-bench لـ GPT-5Verified، رسمي

هذا هو قرار النموذج اليومي الذي يواجهه معظم الفِرق في 2026. ليس أيٌّ من النموذجين هو النموذج المتقدّم في مختبره — فـ Opus 4.8 وGPT-5.5 يقفان فوقهما — لكن هذين النموذجين يحملان جُلّ حركة الإنتاج الحقيقية لأنهما الطبقتان المسعّرتان للحجم الكبير. بُنيا بوصفتين مختلفتين، وورقة الأسعار لا تروي سوى نصف الحكاية.

المواصفات جنباً إلى جنب

Claude Sonnet 4.6 مقابل GPT-5 — أرقام مُتحقَّق منها، 10 يونيو 2026
البُعدClaude Sonnet 4.6GPT-5
الإدخال / 1M$3.00$1.25
الإخراج / 1M$15.00$10.00
الإدخال المخزَّن / 1M$0.30
سعة السياق1,000,000400,000
أقصى إخراج64,000128,000
SWE-bench Verified79.6%74.9%
الإنتاجية (تقدير benchr)95 tok/s90 tok/s

فجوة السعر تنكمش حين تستخدم الكاش

العنوان يقول إن Sonnet يكلّف أكثر بـ 2.4× على الإدخال. والهامش يقول إن لدى Sonnet طبقة إدخال مخزَّن بسعر $0.30 وليس لدى GPT-5 سعر مخزَّن في سجل benchr المُتحقَّق منه. لوكيل ببرومبت نظام بحجم 40K توكن يُستدعى آلاف المرات يومياً، يقلب ذلك الترتيب: يُحتسب البرومبت المتكرر بسعر $0.30/1M على Sonnet، أي أقل من رُبع سعر GPT-5 القياسي البالغ $1.25. أما أحمال العمل عديمة الحالة قصيرة البرومبت فلا ترى هذه الفائدة أبداً — وهذا بالضبط سبب اختلاف الجواب الصحيح من فريق إلى آخر. مرِّر مزيجك الخاص عبر حاسبة التكلفة.

حِمل عمل ملموس

خذ بوت مراجعة شيفرة: 15K توكن إدخال (الفرق + السياق)، 3K إخراج، 20,000 تشغيلة في الشهر. على GPT-5 يساوي ذلك $375 إدخال + $600 إخراج = $975/شهر. وعلى Sonnet 4.6 من دون كاش: $900 + $900 = $1,800/شهر. وإذا كانت 10K من توكنات الإدخال تلك بادئةً مخزَّنة ثابتة، ينزل Sonnet إلى نحو $1,260/شهر. أنت تدفع بضع مئات من الدولارات شهرياً مقابل أفضلية 4.7 نقطة على SWE-bench — وهي رخيصة إذا وفّرت عليك ولو خطأً واحداً فائتاً في الأسبوع، وبلا جدوى إذا كانت مراجعاتك مجرّد فحوص أسلوب بسيطة.

أين يكسب كلٌّ منهما

يكسب Sonnet 4.6 في البرمجة على مستوى المستودع، وفي أي شيء يحتاج أكثر من 400K توكن في نافذة واحدة، وفي الوكلاء كثيري البرومبت الذين يستثمرون الكاش. إنه النموذج الذي تسمّيه مراجعة benchr طبقة النموذج اليومي لسبب وجيه. أما GPT-5 فيكسب في السعر الخام للمهام القصيرة، وفي سقف الإخراج (128K مقابل 64K أقصى إخراج)، وحين تكون منظومتك مبنيةً أصلاً على أشكال API الخاصة بـ OpenAI. السبب الخاطئ لاختيار أيٍّ منهما هو الولاء للعلامة — والسبب الصحيح هو مزيج توكناتك.

أسئلة شائعة

هل يستحق Claude Sonnet 4.6 ضعفَي سعر إدخال GPT-5 ونصف؟

حين يكون العمل برمجةً أو مستندات طويلة، فالجواب عادةً نعم. يسجّل Sonnet 4.6 درجة 79.6% على SWE-bench Verified مقابل 74.9% لـ GPT-5، وسعة سياقه البالغة 1M توكن تساوي 2.5 ضعف سعة GPT-5 البالغة 400K. أما لمحادثات قصيرة قليلة المخرجات ومهام واسعة، فأسعار GPT-5 الأدنى تكسب على صعيد التكلفة.

أيهما أرخص على حِمل عمل حقيقي؟

يعتمد على مزيج الإدخال/الإخراج. مهمة بـ 10K إدخال و2K إخراج تكلّف نحو $0.0325 على GPT-5 و$0.06 على Sonnet 4.6 من دون كاش. ومع سعر الإدخال المخزَّن $0.30 لدى Sonnet على برومبت نظام متكرر، تضيق الفجوة كثيراً — وليس لدى GPT-5 طبقة مخزَّنة في سجل benchr المُتحقَّق منه.

متى يصبح سياق GPT-5 البالغ 400K هو المشكلة؟

حين تحتاج مهمة واحدة إلى أكثر من 300K توكن تقريباً من المواد العاملة — شرائح كبيرة من قاعدة شيفرة، مستندات استكشاف طويلة، تحليل متعدد الملفات. يستوعب Sonnet 4.6 مليون توكن في نافذة واحدة؛ أما GPT-5 فيحتاج عند تلك النقطة إلى التقطيع وطبقة استرجاع، ما يضيف كلفة هندسية لا تظهر في ورقة الأسعار.

سجل التغييرات

  • 10 يونيو 2026 — جرى التوسّع من جدول مواصفات إلى مقارنة كاملة: حساب التكلفة على حِمل عمل ملموس، وأين يكسب كل نموذج، وحُكم نهائي. أُعيدت فهرسة الصفحة.
  • 6 يونيو 2026 — نُشرت كنسخة أولية بجدول مواصفات (غير مفهرسة بانتظار التوسّع).

المراجع

  • أسعار Anthropic — platform.claude.com/docs (تم التحقق في 10 يونيو 2026)
  • أسعار OpenAI API — openai.com/api/pricing (تم التحقق في 10 يونيو 2026)
  • benchr model-figures.json — سجل الأرقام المُتحقَّق منه (10 يونيو 2026)