هذه هي النماذج المتقدمة الثلاثة التي على الأرجح تختار بينها في منتصف 2026: Claude Fable 5 من Anthropic، وGPT-5.5 من OpenAI، وGemini 3.1 Pro من Google. وصلت متقاربة، وكلها تحمل سعة سياق قرابة المليون توكن، وتجلس عند ثلاث نقاط سعرية مختلفة جداً. الصعوبة ليست في تحديد أقوى نموذج نظرياً، بل في أن المزوّدين الثلاثة نشروا كميات متفاوتة جداً من الأدلة، حتى صار التقابل المباشر على البنشماركات غير ممكن أصلاً. هذا المقال يضع أمامك ما كشفه كل مزوّد فعلاً، وينبّهك على الجدول الوحيد الذي يجب ألا تأخذه على ظاهره، ويعطيك توصية لكل حالة استخدام.
ابدأ بصورة الميدان. Gemini 3.1 Pro هو الأرخص بفارق كبير والوحيد من الثلاثة بورقة بنشماركات عامة كاملة. Fable 5 هو الأغلى والأوضح توجهاً نحو العمل الوكيلي طويل المدى، لكن أرقام إطلاقه تحمل علامة استفهام سنصل إليها. أما GPT-5.5 فهو الوسط المُحرِج: متوسط السعر، واسع القدرة بحسب السمعة، وشبه موثَّق على البنشماركات التي تهم لترتيبه أمام الآخرين.
السعر: الفجوة ضخمة
الفارق هنا أوسع من التزاحم المعتاد في الطبقة المتقدمة. Gemini 3.1 Pro سعره دولاران لكل مليون توكن إدخال و12 دولاراً للإخراج للطلبات حتى 200K توكن، ثم يقفز إلى 4 و18 دولاراً فوق 200K، مع احتساب توكنز التفكير ضمن سعر الإخراج. GPT-5.5 عند 5 دولارات إدخالاً و30 دولاراً إخراجاً، وإدخال إصابة الكاش عنده 0.50 دولار. وClaude Fable 5 هو الأغلى بـ10 دولارات إدخالاً و50 دولاراً إخراجاً. لكن تخزين السياق في Fable 5 قوي: خصم 90% على الإدخال يهبط بإدخال إصابة الكاش إلى دولار واحد، وهذا فارق كبير في الحلقات الوكيلية التي تعيد قراءة السياق نفسه دورة بعد دورة.
هناك تفصيلان سعريان يسهل تفويتهما. سعة سياق GPT-5.5 ليست مليوناً مدوّراً، بل 1,050,000 توكن، وأي جلسة تتجاوز 272K توكن إدخال تحمل رسماً إضافياً: ضعف على الإدخال ومرة ونصف على الإخراج. وتسعير Gemini المُدرَّج ينقلب عند 200K، فالمهمة طويلة السياق على Gemini تُسعَّر بشكل مختلف تماماً عن القصيرة. اقرأ الشريحة التي ستقع فيها فعلاً، لا السعر المعلن في العنوان.
| المواصفة | Claude Fable 5 | GPT-5.5 | Gemini 3.1 Pro |
|---|---|---|---|
| سعر الإدخال (لكل مليون) | $10 ($1 إصابة كاش) | $5 ($0.50 إصابة كاش) | $2 حتى 200K، و$4 فوقها |
| سعر الإخراج (لكل مليون) | $50 | $30 | $12 حتى 200K، و$18 فوقها |
| سعة السياق | مليون توكن | 1,050,000 توكن | مليون توكن |
| أقصى إخراج | 128K توكن | 128K توكن | 64K توكن |
| أبرز بنشمارك منشور | SWE-bench Pro 80.3 (انظر التنبيه) | HealthBench 56.5 | SWE-bench Verified 80.6 |
| التوفر | مجاني على خطط Claude المدفوعة 9–22 يونيو، ثم رصيد | API مدفوع | معاينة، بلا طبقة API مجانية |
البنشماركات: مزوّد واحد فقط أعطاك ورقة كاملة
هنا تخرج المقارنة عن المألوف، لأن المزوّدين الثلاثة نشروا كميات متباينة جذرياً. Gemini 3.1 Pro هو الموثَّق. نشرت Google نتائج ARC-AGI-2 عند 77.1، وGPQA Diamond عند 94.3، وHumanity's Last Exam مع الأدوات عند 51.4، وMMMU-Pro عند 80.5، وSWE-bench Verified عند 80.6، وMMMLU عند 92.6. ورقة واسعة تغطي الاستدلال والعلوم والوسائط المتعددة والبرمجة، ولهذا هو النموذج الوحيد هنا الذي تستطيع فعلاً وضعه على لوحة ترتيب.
تصدّر Claude Fable 5 بـSWE-bench Pro عند 80.3، وظاهرياً هذا رقم برمجة وكيلية قوي. لكن هناك مصيدة عليك فهمها قبل اقتباسه. جدول إطلاق Anthropic يسجّل الأعلى بين Mythos 5 وFable 5 في كل صف، والصفوف المعلَّمة بنجمة، ومنها السيبراني والأحياء وبعض نتائج الاستدلال، تعكس Mythos 5، الشقيق المقيَّد، لا Fable 5. على تلك المهام المعلَّمة يقترب أداء Fable 5 اليومي من Opus 4.8 لأن مصنّفات الأمان تعترض الطلب وتُحيله إلى النموذج الأصغر. كما أن Anthropic لم تنشر SWE-bench Verified ولا GPQA لـFable 5 عند الإطلاق، فلا يوجد رقم برمجة أو علوم نظيف يقابل أرقام Gemini.
GPT-5.5 هو الذي ببساطة لا تستطيع ترتيبه. بنشماركات OpenAI الرسمية الوحيدة للنموذج الرئيسي هي HealthBench 56.5 (المعدّل حسب الطول) وHealthBench Professional 51.8. لم تنشر SWE-bench ولا Terminal-Bench ولا OSWorld. لا يوجد بنشمارك برمجة أو استدلال مشترك بين GPT-5.5 والآخرين، فأي ترتيب ورقي أمام Fable 5 أو Gemini 3.1 Pro سيكون مُختلَقاً. ولن نختلق واحداً. إن كان رقم برمجة أو استدلال لـGPT-5.5 مهماً لقرارك، فالجواب الصادق أن OpenAI لم تنشره.
السياق والحدود: متقارب، لا متطابق
الثلاثة كلها نماذج بسعة قرابة المليون توكن، وهو ما كان قبل عام هو العنوان وصار اليوم الحد الأدنى. Fable 5 وGemini 3.1 Pro يذكران مليون توكن سياقاً. وGPT-5.5 يتفوق قليلاً عند 1,050,000، رغم أنك كما ذُكر تدفع رسماً إضافياً بعد 272K توكن إدخال. الفارق العملي الأكبر في الإخراج: Fable 5 وGPT-5.5 يحدّان عند 128K توكن إخراج، بينما يحدّ Gemini 3.1 Pro عند 64K. إن كانت مهمتك توليد ردود مفردة طويلة جداً، فسقف Gemini نصف الآخرين، وقد يجبرك ذلك على تقطيع عمل ينجزه الآخران دفعة واحدة.
حدّ آخر يستحق أن يترسّخ عندك: Gemini 3.1 Pro يدمج توكنز التفكير في سعر الإخراج. فالاستدعاء كثيف الاستدلال على Gemini يُحتسب تفكيره على سعر الإخراج ذاك، ما يجعل رقم الإخراج "الرخيص" أقل رخصاً على الاستدلال الصعب مما يبدو أولاً. يبقى الأرخص بين الثلاثة، لكنه ليس رخيصاً كما يوحي السعر المعلن متى فكّر النموذج بعمق.
التوفر: واحد مجاني الآن، وآخر بلا API مجاني إطلاقاً
قصص الوصول مختلفة كاختلاف الأسعار. Claude Fable 5 مجاني للاستخدام داخل خطط Claude المدفوعة Pro وMax وTeam وEnterprise من 9 إلى 22 يونيو 2026، مع رصيد استخدام يبدأ من 23 يونيو. هذا العرض يخص منتج Claude، لا API الخام. وهناك قيد صارم عليك أخذه بالحسبان: طلبات السيبراني والأحياء والتقطير (distillation) تُحال إلى Opus 4.8 بدل أن تُشغَّل على Fable 5، وهو القيد الأمني نفسه الذي يجعل تلك الأرقام المعلَّمة بنجمة مضلِّلة.
GPT-5.5 وصول مدفوع مباشر عبر API. لكن انتبه للتسمية: النموذج الرئيسي GPT-5.5 أُعلن في 23 أبريل 2026، وهو متمايز عن "GPT-5.5 Instant" الذي صار افتراضي ChatGPT منذ 5 مايو 2026. ليسا النموذج نفسه، وإن كنت تختبر البنشماركات فتأكد أنك تستدعي النموذج الرئيسي. أما Gemini 3.1 Pro فليس له طبقة API مجانية إطلاقاً، بل تجربة عبر واجهة AI Studio فقط، وما زال رسمياً في مرحلة معاينة، صدر في 19 فبراير 2026، فقد تتغير أسعاره وحدوده.
أي نموذج لأي عمل
للعمل اليومي حيث تهم التكلفة والقدرة الواسعة معاً، اجعل Gemini 3.1 Pro الافتراضي. هو الأرخص بفارق كبير، ولديه ورقة البنشماركات الكاملة الوحيدة، وSWE-bench Verified 80.6 يعني أنك لا تضحّي بقدرة مقيسة كبيرة مقابل التوفير. الأمران اللذان تنتبه لهما: سقف الإخراج 64K واحتساب توكنز التفكير ضمن الإخراج على الاستدلال الصعب. لمعظم الفرق هذا هو الافتراضي المنطقي، ومراجعة Gemini 3.1 Pro الكاملة تتعمق أكثر في مواضع ضعفه.
للهندسة الوكيلية الصعبة طويلة المدى حين تريد أقوى أداة والميزانية ثانوية، اذهب إلى Claude Fable 5، خصوصاً خلال نافذة 9–22 يونيو المجانية على خطط Claude المدفوعة. تخزين السياق فيه يجعل السعر المعلن المرتفع أكثر احتمالاً في الحلقات الوكيلية التي تعيد قراءة السياق. فقط ادخل وأنت مدرك لمسألة الجدول: صفوف السيبراني والأحياء اللافتة تخص Mythos 5، وعلى المهام المحجوبة أمنياً تحصل على ما يقارب Opus 4.8. وتفصيل إطلاق Fable 5 يشرح مسألة جدول الشقيق بالتفصيل.
GPT-5.5 هو الأصعب في بناء حجة نظيفة له على الورق، لمجرد أن OpenAI أعطتك القليل جداً لتبني عليه. إن كنت أصلاً تبني على منظومة OpenAI فـGPT-5.5 ترقية معقولة متوسطة السعر، وأرقام HealthBench عنده قوية فعلاً للعمل القريب من المجال الصحي. لكن إن كنت تختار من جديد وتريد الترتيب بالأدلة، فيصعب ترشيحه على Gemini الذي نشر كل شيء، أو على Fable 5 الذي نشر على الأقل درجة برمجته الوكيلية. ومراجعة GPT-5.5 تغطي ما تشتريه الترقية فوق GPT-5.
الخلاصة في سطر: Gemini 3.1 Pro للقيمة والشمول، وClaude Fable 5 للعمل الوكيلي المتميّز مع قراءة التنبيه، وGPT-5.5 فقط إن كانت منظومة OpenAI أو قوته في HealthBench هي سببك أصلاً. لا أحد من الثلاثة هو الفائز البديهي على كل محور، وهذه هي الحال الصادقة للجبهة المتقدمة في منتصف 2026.