مقارنة·يونيو 2026

GPT-5 مقابل Claude Opus 4.8: فجوة السعر تلتقي فجوة البنشمارك

سعر إدخال Opus 4.8 أعلى بأربع مرات، ونتيجته المنشورة على SWE-bench أعلى بنحو 14 نقطة. لا تتحول هذه الفجوة تلقائيًا إلى فرق مماثل في مهامك.

بقلم فريق benchr · حُدِّث في 29 يوليو 2026 · تم التحقق من الأرقام من مصادر رسمية في 24 يوليو 2026 · عرض سجل التغييرات

إدخال GPT-5 / 1M OpenAI · صدر في أغسطس 2025

إدخال Opus 4.8 / 1M Anthropic · صدر في مايو 2026

SWE-bench لـ GPT-5 رقم OpenAI الرسمي

SWE-bench لـ Opus 4.8 رقم Anthropic الرسمي

المواصفات في جدول واحد

GPT-5 مقابل Claude Opus 4.8 — أرقام من وثائق المزوّدين الرسمية
البُعد	GPT-5	Claude Opus 4.8
المزوّد	OpenAI	Anthropic
تاريخ الإصدار	7 أغسطس 2025	28 مايو 2026
الإدخال / 1M	$1.25	$5.00
الإخراج / 1M	$10.00	$25.00
الإدخال المخزَّن / 1M	$0.125 (خصم 90%)	$0.50 (خصم 90%)
سعة السياق	400,000 توكن	1,000,000 توكن
أقصى إخراج	128,000 توكن	128,000 توكن
SWE-bench Verified	74.9%	88.6%
GPQA Diamond	غير منشور	93.6%
الوضع السريع	لا	نعم — $10/$50، سرعة ~2.5×

فجوة السعر بأرقام حقيقية

عند 10 ملايين توكن إدخال شهريًا، تبلغ كلفة الإدخال $12.50 على GPT-5 و$50 على Opus 4.8. وعند 500 مليون توكن تصبح $625 و$2,500 على الترتيب. هذه حسبة إدخال فقط؛ أضف الإخراج وإعادة المحاولة وأي رسوم أخرى قبل اعتماد الميزانية.

يمنح النموذجان خصمًا بنسبة 90% على الإدخال المؤهل للتخزين المؤقت: $0.125 لكل مليون توكن لدى GPT-5 و$0.50 لدى Opus. لذلك تكلّف قراءة بادئة مخزّنة بحجم 40 ألف توكن نحو $0.005 لكل استدعاء على GPT-5 و$0.02 على Opus. احسب معدل الإصابة الفعلي وحجم الإخراج بدل افتراض أن كل الإدخال مؤهل للخصم.

ماذا تعني فعلاً فجوة البرمجة البالغة 14 نقطة

يستخدم SWE-bench Verified مشكلات حقيقية من مستودعات Python، لكن النتيجة تعتمد على إعداد الاختبار والأدوات وسياسة المحاولة. الرقم 88.6% لا يعني أن Opus سيصلح 88 من كل 100 مشكلة في مستودعك، كما أن 74.9% لا يحدد معدل نجاح GPT-5 لديك.

تستحق الفجوة الاهتمام عندما تكون البرمجة محور المنتج، لكنها تظل نقطة بداية للاختبار. اختر عينة من الأخطاء التي أصلحها فريقك سابقًا، وثبّت الأدوات وحدود الوقت وعدد المحاولات، ثم قارن الإصلاحات المقبولة ووقت المراجعة. بهذه الطريقة تتحول الدرجة العامة إلى قرار يخص بيئتك.

أما الكتابة والتلخيص وشرح الشيفرة، فلا تقيسها SWE-bench مباشرةً. لا تفترض أن فارق البرمجة سيظهر بالحجم نفسه في تلك المهام؛ ضع لها معايير منفصلة.

سعة السياق: حين لا يكفي 400K

قد تكفي سعة GPT-5 البالغة 400 ألف توكن لكثير من الطلبات، لكنها تصبح قيدًا إذا تجاوزت مواد المهمة هذا الحد. يتيح Opus 4.8 سعة معلنة تبلغ مليون توكن، إلا أن قبول النص لا يضمن استرجاع كل جزء منه بدقة. اختبر مواضع الدليل المختلفة، وزمن الاستجابة، والكلفة قبل الاعتماد على الطلبات الطويلة.

من ينبغي أن يستخدم كل نموذج

ابدأ باختبار GPT-5 إذا: كانت الكلفة أولوية، أو كانت مهامك ضمن سعة 400 ألف توكن، أو كانت منظومتك تعتمد على أدوات OpenAI. تحقّق من الجودة على حالاتك قبل توجيه الاستخدام.

أضف Opus 4.8 إلى الاختبار إذا: احتجت سياقًا أكبر، أو كانت مهام البرمجة صعبة، أو أظهر تقييمك أن فرق الجودة يخفّض وقت المراجعة أو عدد المحاولات بما يبرر السعر.

أسئلة شائعة

هل أستطيع استخدام GPT-5 وOpus 4.8 في الخط نفسه؟

نعم، لكنك تحتاج طبقة توجيه توحّد الرسائل والأدوات والأخطاء بين الواجهتين. ابدأ بمهمة واضحة يمكن توجيهها وفق قاعدة قابلة للقياس، ثم اختبر المسار الاحتياطي وسجّل سبب كل تحويل بدل افتراض توافق الواجهتين.

هل يغيّر وضع Opus السريع المقارنة؟

تدرج الصفحة وضع Opus السريع بسعر $10/$50 لكل مليون توكن، مع رقم سرعة تقريبي من المزوّد. لا يكفي ذلك لتوقّع زمن الاستجابة في منطقتك؛ اختبر الوضعين على الطلبات نفسها واحسب أثر السرعة في تجربة المستخدم والكلفة.

أيهما أفضل للكتابة والتحليل، لا البرمجة وحدها؟

لا تعرض هذه الصفحة تقييمًا مباشرًا للكتابة أو التلخيص بين النموذجين. درجات SWE-bench وGPQA لا تقيس الأسلوب أو دقة التلخيص؛ لذلك اختبر عينة من نصوصك بمعايير واضحة مثل صحة الوقائع واتباع النبرة ووقت المراجعة.

سجل التغييرات

29 يوليو 2026 — فُصلت نتائج الاختبارات المرجعية عن معدل النجاح المتوقع في الإنتاج، وصُحّح مثال الكلفة عند 500 مليون توكن إدخال، ووُضّحت فروق الواجهتين.
24 يوليو 2026 — صُحّح سعر الإدخال المخزَّن لـ GPT-5 إلى $0.125/1M، وحُدّثت مقارنة التخزين المؤقت.
6 يونيو 2026 — نُشرت. جرى التحقق من كل الأسعار والبنشماركات مقابل وثائق OpenAI وAnthropic الرسمية.

المراجع

وثائق نموذج GPT-5 من OpenAI — التسعير ودعم تخزين البرومبت (تم التحقق في 24 يوليو 2026)
أسعار Anthropic API — docs.anthropic.com (تم التحقق في 3 يونيو 2026)
أسعار الوضع السريع لـ Anthropic — anthropic.com/news/claude-opus-4 (تم التحقق في 3 يونيو 2026)
benchr model-figures.json — المصدر الأوحد للحقيقة، تم الاطلاع في 24 يوليو 2026

GPT-5 مقابل Claude Opus 4.8: فجوة السعر تلتقي فجوة البنشمارك

المواصفات في جدول واحد

فجوة السعر بأرقام حقيقية

ماذا تعني فعلاً فجوة البرمجة البالغة 14 نقطة

سعة السياق: حين لا يكفي 400K

من ينبغي أن يستخدم كل نموذج

أسئلة شائعة

سجل التغييرات

المراجع

Claude Sonnet 4.6 مقابل GPT-5.

GPT-5 مقابل Gemini 3.5 Flash.

DeepSeek V4-Pro مقابل Claude Sonnet 4.6.

DeepSeek V4-Pro مقابل GPT-5.

Claude Opus 4.8، مراجعة.