معظم مراجعات النماذج تجري في أسبوع الإطلاق، حين تكون القصة الوحيدة المتاحة هي قصة المزوّد. هذه المراجعة متأخرة بقصد ثلاثة أشهر. نزل GPT-5.4 في 5 مارس 2026 بوصفه "أقدر وأكفأ نموذج متقدم لدينا للعمل الاحترافي"، احتفظ بذلك الموقع سبعة أسابيع، وسلّم التاج لـ GPT-5.5 في 23 أبريل. الآن هدأ غبار التسويق، واستقرت الأسعار، والسؤال الذي يستحق الإجابة ليس "هل هو مبهر" بل "من ينبغي أن يشتريه بعد". المزيد من النماذج يستحق هذه المعاملة.
ما الذي أتى به ولم يكن في GPT-5
ثلاثة أشياء، كلها ما زالت صحيحة. أولاً، سعة السياق: حتى 1M توكن مقابل 400K في GPT-5، مع التحفّظ بأن نافذة السعر القياسي هي 272K والمدخلات الأطول تحمل رسماً إضافياً بحسب صفحة أسعار OpenAI. ثانياً، استخدام الكمبيوتر، مدمج لا مُلحَق: 75% على OSWorld-Verified بحسب مادة الإطلاق من OpenAI، مقابل 47.3% لـ GPT-5.2 وخط أساس بشري 72.4%. نموذج يتجاوز الخط البشري في مهام سطح المكتب غيّر ما تستطيع الفرق أتمتته، وتلك القدرة لم تنتهِ صلاحيتها حين وصل GPT-5.5. ثالثاً، الدقة: ذكرت OpenAI أن الردود أقل احتمالاً بنسبة 18% أن تحوي أخطاء مقارنة بـ GPT-5.2، وأن الادعاءات المفردة أقل احتمالاً للخطأ بنسبة 33%.
الضبط المالي هو الهوية
بنت OpenAI نموذج GPT-5.4 مع ممارسي المالية، وذكرت أن بنشمارك الخدمات الاستثمارية الداخلي قفز من 43.7% مع GPT-5 إلى 87.3% مع GPT-5.4 Thinking. أُطلق النموذج بالتوازي مع ChatGPT for Excel في اليوم نفسه، تلتها تكاملات بيانات FactSet وS&P Global وMoody's. تلك أرقام مزوّد على بنشمارك مزوّد، فأمسكها بتحفّظ. لكن استراتيجية المنتج التي تصفها حقيقية ومرئية: هذا هو النموذج الذي وجّهته OpenAI لمن وظيفتهم دفتر حسابات. تغطي جولة أفضل ذكاء اصطناعي للجداول كيف نزل ذلك الرهان عملياً.
أين السجل ضعيف
لم تُنشر درجة SWE-bench Verified رسمية لـ GPT-5.4، وهو أمر غير معتاد لإصدار متقدم في 2026، ويعني أن موقعه في البرمجة يقوم على تقديرات. يحمل فهرس benchr تقديراً تحريرياً قدره 80% (مُعلَّماً كتقدير، يقع بين 74.9% الرسمية لـ GPT-5 و84.0% الرسمية لـ GPT-5.5)، وعليك أن تعامله بهذه الصفة بالضبط. إن كان قرار شرائك معلقاً على أرقام برمجة مُتحقَّقة، فإن GPT-5.5 وClaude Opus 4.8 ينشران أرقامهما؛ أما GPT-5.4 فيجعلك تختبر بنفسك.
مقابل GPT-5.5: سؤال التنصيف
يكلّف GPT-5.5 الضعف بالضبط — $5/$30 مقابل $2.50/$15 — ومكاسبه المنشورة حقيقية: 84.0% على SWE-bench Verified، برمجة وكيلية أقوى، واهتمام الضبط الخاص بالنموذج الرائد الجديد. الفصل الصادق: إن كان عملك وكلاء برمجة متقدمين أو تحتاج سقف البنشمارك المُتحقَّق، فادفع لـ 5.5. وإن كان عملك مستندات وجداول واستخدام كمبيوتر وتحليل سياق طويل، فإن GPT-5.4 ينجز المهمة بنصف السعر، وبنية الرسوم الإضافية متطابقة فلا أحدهما ينجو من حد الـ272K. حسابات السعر الكاملة موجودة في تفصيل أسعار GPT-5.4.
هامش العائلة
تبع GPT-5.4 mini وnano في 17 مارس. صار mini نموذج ChatGPT للفئة المجانية، ما يخبرك بأرضية جودته؛ أما nano فعبر API فقط للعمل بالحجم. لا أحدهما في سجل أرقام benchr المُتحقَّقة بأسعار رسمية لكل توكن بعد، فهذه المراجعة تقيّم النموذج الرئيسي وحده. هامش أخير للجدول الزمني: GPT-5.3 Instant، وهو نموذج ChatGPT سريع منفصل افتراضي من 3 مارس، لا علاقة له بعائلة API هذه رغم الرقم المجاور — تسمية OpenAI لم تخدم أحداً ذلك الشهر.