GPT-5 مقابل Gemini 3.5 Flash: الميزانية نفسها، آلتان مختلفتان

بضعة سنتات تفصل بين ورقتَي الأسعار. وكل ما يهمّ يقع في أعمدة الهندسة: السرعة والسياق والطبقة المجانية.

بقلم فريق benchr · · عرض سجل التغييرات · تم التحقق من الأرقام من مصادر رسمية في 10 يونيو 2026

إدخال GPT-5 / 1MOpenAI · إخراج $10
إدخال Flash / 1MGoogle · إخراج $9
إنتاجية Flashتتبّع benchr · GPT-5: 90
سياق FlashGPT-5: 400K

نموذجان، ميزانية واحدة، آلتان مختلفتان تماماً. هذه هي المقارنة النادرة التي تستطيع فيها تجاهل ورقة الأسعار — بضعة سنتات لكل مليون توكن تفصل بينهما في أيٍّ من الاتجاهين بحسب نسبة الإدخال/الإخراج لديك. كل ما يهمّ هنا يقع في أعمدة الهندسة.

المواصفات جنباً إلى جنب

GPT-5 مقابل Gemini 3.5 Flash — أرقام مُتحقَّق منها، 10 يونيو 2026
البُعدGPT-5Gemini 3.5 Flash
الإدخال / 1M$1.25$1.50
الإخراج / 1M$10.00$9.00
الإدخال المخزَّن / 1M$0.15
طبقة API مجانيةلانعم
سعة السياق400,0001,048,576
أقصى إخراج128,00065,536
أول توكن (تقدير benchr)520ms195ms
الإنتاجية (تقدير benchr)90 tok/s289 tok/s

السرعة هي عرض Flash كله

عند 195ms حتى أول توكن و289 توكن/ثانية في تتبّع benchr، يُعدّ Flash من أسرع النماذج بطبقة المقدّمة في السوق — أسرع بنحو 3× من إنتاجية GPT-5. للمحادثة الموجَّهة للمستخدم، ومساعدي البرمجة الحيّة، وأي منتج يراقب فيه أحدٌ بثّ الإجابة، يكون ذلك الفارق مرئياً بالعين المجرّدة. إجابة من 2,000 توكن تستغرق نحو 7 ثوانٍ في البثّ على Flash و22 على GPT-5. لا يوجد خصم سعر يشتري لك خمس عشرة ثانية من انتباه المستخدم.

أين يصمد GPT-5

سقف الإخراج والمنظومة. أقصى إخراج لـ GPT-5 البالغ 128K يضاعف 64K لدى Flash — وهذا مهمّ لتوليدات الشيفرة الطويلة وصياغة المستندات في استدعاء واحد. وحكاية التكامل تتكرّر من كل مقارنة مع OpenAI: أُطُر أكثر، واستدعاء دوال أكثر اختباراً في الميدان، وتوافق فوري أكثر. أما في البرمجة، فيتتبّع benchr لـ Flash درجة 80.6% على SWE-bench Verified مقابل 74.9% الرسمية لـ GPT-5 — اقرأ تلك الفجوة على أنها إرشادية، إذ إن رقم Flash تقدير تحريري في فهرس benchr، مُعلَّم على هذا النحو، بينما رقم GPT-5 رسمي. وفي مراجعة Flash الصورة الأكمل.

التواء الطبقة المجانية

لدى Flash طبقة API مجانية؛ وGPT-5 لا. للنماذج الأولية والأدوات الداخلية والمشاريع الجانبية منخفضة الحجم، ليس ذلك خطأ تقريب — بل هو الفاتورة كلها. ينبغي لكثير من الفِرق أن تصنع نماذجها الأولية على طبقة Flash المجانية، وتقيس، ثم تقرّر بعدها فقط أين تذهب حركة المرور المدفوعة. وفي جولة الذكاء الاصطناعي المجاني خريطة لحدود الطبقة المجانية.

أسئلة شائعة

يكلّف GPT-5 وGemini 3.5 Flash السعر نفسه تقريباً — فما الفرق الحقيقي؟

الشكل، لا السعر. بُني Flash للسرعة والنطاق: نحو 195ms حتى أول توكن و289 توكن/ثانية في تتبّع benchr، أي ثلاثة أضعاف إنتاجية GPT-5 تقريباً، مع نافذة سياق Gemini 3.5 Flash البالغة 1M مقابل 400K لـ GPT-5. وGPT-5 هو النموذج العام الأثبت بدعم منظومة أعمق. وبسعر $1.25/$10 مقابل $1.50/$9 لكل مليون، لن يحسم السعر هذه المقارنة.

أيهما أرخص لتطبيق محادثة؟

متطابقان تقريباً. دورة محادثة بـ 2K إدخال و500 توكن إخراج تكلّف نحو $0.0075 على أيٍّ من النموذجين. يتقدّم Flash في RAG كثيف الإدخال بفضل طبقة الإدخال المخزَّن $0.15/1M لدى Gemini 3.5 Flash وطبقة API مجانية للنماذج الأولية؛ ويتقدّم GPT-5 في المزائج كثيفة البرومبت حيث يهيمن سعر إدخاله الأدنى $1.25. العوامل الحاسمة هي السرعة والسياق، لا الفاتورة.

هل يتفوّق Gemini 3.5 Flash فعلاً على GPT-5 في البرمجة؟

يتتبّع benchr لـ Flash درجة 80.6% على SWE-bench Verified مقابل 74.9% الرسمية لـ GPT-5 — لكن لاحظ أن رقم Flash تقدير تحريري في بيانات benchr، مُعلَّم على هذا النحو، بينما رقم GPT-5 رسمي. تعامَل مع الفجوة على أنها إرشادية، واختبر على مهامك الخاصة.

سجل التغييرات

  • 10 يونيو 2026 — جرى التوسّع من جدول مواصفات إلى مقارنة كاملة: حساب التكلفة على حِمل عمل ملموس، وأين يكسب كل نموذج، وحُكم نهائي. أُعيدت فهرسة الصفحة.
  • 6 يونيو 2026 — نُشرت كنسخة أولية بجدول مواصفات (غير مفهرسة بانتظار التوسّع).

المراجع

  • أسعار OpenAI API — openai.com/api/pricing (تم التحقق في 10 يونيو 2026)
  • أسعار Google Gemini API — ai.google.dev/gemini-api/docs/pricing (تم التحقق في 10 يونيو 2026)
  • benchr model-figures.json — سجل الأرقام المُتحقَّق منه (10 يونيو 2026)