GPT-5.4، مراجعة: خيار القيمة الذي لا تروّج له OpenAI

احتفظ بتاج النموذج الرائد سبعة أسابيع. مراجعته بعد انتقال التاج هي اللحظة التي يصدُق فيها حديث سعر-الأداء.

بقلم فريق benchr · · عرض سجل التغييرات · الأرقام مُتحقَّق منها مقابل مصادر رسمية، 10 يونيو 2026

الإدخال / 1Mالإخراج $15 · OpenAI
OSWorld-Verifiedخط الأساس البشري: 72.4%
بنشمارك الماليةداخلي لـ OpenAI · سجّل GPT-5 ‏43.7%
سعة السياقرسم إضافي فوق 272K

معظم مراجعات النماذج تجري في أسبوع الإطلاق، حين تكون القصة الوحيدة المتاحة هي قصة المزوّد. هذه المراجعة متأخرة بقصد ثلاثة أشهر. نزل GPT-5.4 في 5 مارس 2026 بوصفه "أقدر وأكفأ نموذج متقدم لدينا للعمل الاحترافي"، احتفظ بذلك الموقع سبعة أسابيع، وسلّم التاج لـ GPT-5.5 في 23 أبريل. الآن هدأ غبار التسويق، واستقرت الأسعار، والسؤال الذي يستحق الإجابة ليس "هل هو مبهر" بل "من ينبغي أن يشتريه بعد". المزيد من النماذج يستحق هذه المعاملة.

ما الذي أتى به ولم يكن في GPT-5

ثلاثة أشياء، كلها ما زالت صحيحة. أولاً، سعة السياق: حتى 1M توكن مقابل 400K في GPT-5، مع التحفّظ بأن نافذة السعر القياسي هي 272K والمدخلات الأطول تحمل رسماً إضافياً بحسب صفحة أسعار OpenAI. ثانياً، استخدام الكمبيوتر، مدمج لا مُلحَق: ‏75% على OSWorld-Verified بحسب مادة الإطلاق من OpenAI، مقابل 47.3% لـ GPT-5.2 وخط أساس بشري 72.4%. نموذج يتجاوز الخط البشري في مهام سطح المكتب غيّر ما تستطيع الفرق أتمتته، وتلك القدرة لم تنتهِ صلاحيتها حين وصل GPT-5.5. ثالثاً، الدقة: ذكرت OpenAI أن الردود أقل احتمالاً بنسبة 18% أن تحوي أخطاء مقارنة بـ GPT-5.2، وأن الادعاءات المفردة أقل احتمالاً للخطأ بنسبة 33%.

الضبط المالي هو الهوية

بنت OpenAI نموذج GPT-5.4 مع ممارسي المالية، وذكرت أن بنشمارك الخدمات الاستثمارية الداخلي قفز من 43.7% مع GPT-5 إلى 87.3% مع GPT-5.4 Thinking. أُطلق النموذج بالتوازي مع ChatGPT for Excel في اليوم نفسه، تلتها تكاملات بيانات FactSet وS&P Global وMoody's. تلك أرقام مزوّد على بنشمارك مزوّد، فأمسكها بتحفّظ. لكن استراتيجية المنتج التي تصفها حقيقية ومرئية: هذا هو النموذج الذي وجّهته OpenAI لمن وظيفتهم دفتر حسابات. تغطي جولة أفضل ذكاء اصطناعي للجداول كيف نزل ذلك الرهان عملياً.

أين السجل ضعيف

لم تُنشر درجة SWE-bench Verified رسمية لـ GPT-5.4، وهو أمر غير معتاد لإصدار متقدم في 2026، ويعني أن موقعه في البرمجة يقوم على تقديرات. يحمل فهرس benchr تقديراً تحريرياً قدره 80% (مُعلَّماً كتقدير، يقع بين 74.9% الرسمية لـ GPT-5 و84.0% الرسمية لـ GPT-5.5)، وعليك أن تعامله بهذه الصفة بالضبط. إن كان قرار شرائك معلقاً على أرقام برمجة مُتحقَّقة، فإن GPT-5.5 وClaude Opus 4.8 ينشران أرقامهما؛ أما GPT-5.4 فيجعلك تختبر بنفسك.

مقابل GPT-5.5: سؤال التنصيف

يكلّف GPT-5.5 الضعف بالضبط — $5/$30 مقابل $2.50/$15 — ومكاسبه المنشورة حقيقية: ‏84.0% على SWE-bench Verified، برمجة وكيلية أقوى، واهتمام الضبط الخاص بالنموذج الرائد الجديد. الفصل الصادق: إن كان عملك وكلاء برمجة متقدمين أو تحتاج سقف البنشمارك المُتحقَّق، فادفع لـ 5.5. وإن كان عملك مستندات وجداول واستخدام كمبيوتر وتحليل سياق طويل، فإن GPT-5.4 ينجز المهمة بنصف السعر، وبنية الرسوم الإضافية متطابقة فلا أحدهما ينجو من حد الـ272K. حسابات السعر الكاملة موجودة في تفصيل أسعار GPT-5.4.

هامش العائلة

تبع GPT-5.4 mini وnano في 17 مارس. صار mini نموذج ChatGPT للفئة المجانية، ما يخبرك بأرضية جودته؛ أما nano فعبر API فقط للعمل بالحجم. لا أحدهما في سجل أرقام benchr المُتحقَّقة بأسعار رسمية لكل توكن بعد، فهذه المراجعة تقيّم النموذج الرئيسي وحده. هامش أخير للجدول الزمني: GPT-5.3 Instant، وهو نموذج ChatGPT سريع منفصل افتراضي من 3 مارس، لا علاقة له بعائلة API هذه رغم الرقم المجاور — تسمية OpenAI لم تخدم أحداً ذلك الشهر.

أسئلة شائعة

هل ما زال GPT-5.4 يستحق الاستخدام بعد GPT-5.5؟

نعم، لشكل محدد من العمل. يكلّف نصف GPT-5.5 بالضبط ويحتفظ بالميزتين اللتين فصلتاه عن GPT-5: سعة سياق حتى 1M توكن واستخدام كمبيوتر مدمج عند 75% على OSWorld-Verified. إن كنت تحتاج هذين دون سقف بنشمارك النموذج الرائد، فهو الشراء الأفضل.

في ماذا يتفوق GPT-5.4؟

عمل المستندات الاحترافي. ضبطته OpenAI على مسارات عمل مالية حقيقية (بنشمارك الخدمات الاستثمارية الداخلي: 43.7% مع GPT-5، 87.3% مع GPT-5.4 Thinking) وأطلقته بالتوازي مع ChatGPT for Excel. استخدام الكمبيوتر مدمج، عند 75% على OSWorld-Verified مقابل خط أساس بشري 72.4%.

ما نقاط ضعف GPT-5.4؟

لا درجة SWE-bench Verified رسمية، فموقعه في البرمجة يقوم على تقديرات. سعة الـ1M المعلنة تحمل رسماً إضافياً فوق نافذة الـ272K القياسية. وانتقل اهتمام OpenAI إلى GPT-5.5 بعد سبعة أسابيع من الإطلاق، فتوقّع تحديثات أقل مما يناله النموذج الرائد.

سجل التغييرات

  • 10 يونيو 2026 — نُشرت كمراجعة استرجاعية مقصودة، بعد ثلاثة أشهر من إطلاق 5 مارس. الأسعار وسعة السياق مُتحقَّقة من صفحة أسعار OpenAI؛ وأرقام OSWorld والدقة والمالية منسوبة إلى مادة الإطلاق من OpenAI؛ وفجوة SWE-bench مُعلَّمة كثغرة صادقة في السجل.

المراجع

  1. OpenAI, "Introducing GPT-5.4 mini and nano," openai.com، 17 مارس 2026.
  2. OpenAI API pricing, openai.com/api/pricing، تم التحقق في 10 يونيو 2026.
  3. OpenAI, "Introducing ChatGPT for Excel and new financial data integrations," openai.com، 5 مارس 2026.
  4. OpenAI model release notes, help.openai.com، اطُّلع عليه في 10 يونيو 2026.