تسعير Gemini 3.5 Flash: الطليعة الأسرع

يولّد Gemini 3.5 Flash ‏289 توكن في الثانية — ثلاثة أضعاف سرعة إخراج GPT-5. وعند 1.50 دولار لكل مليون إدخال مع طبقة مجانية، وربط بحث أصيل، وأعلى درجة رؤية بين كل النماذج المتابَعة هنا، هو الافتراضي للوكلاء الحسّاسين لزمن الاستجابة، والخطوط عالية الإنتاجية، ومهام الوسائط المتعددة.

من فريق benchr · · الأرقام محقّقة مقابل المصادر الرسمية، يونيو 2026 · سجل التغييرات

الإدخال / مليونGoogle · مايو 2026
الإخراج / مليونGoogle
SWE-benchتقديري
السياقأقصى نافذة

تفصيل التسعير

gemini-3.5-flash — التسعير الرسمي من Google AI
الطبقةالسعر / مليون توكن
إدخال قياسي$1.50
إخراج قياسي$9.00
إدخال مخزَّن مؤقتًا$0.15
الطبقة المجانيةمتاحة (بحدود معدّل)
سعة السياق1,048,576 توكن
أقصى إخراج65,536 توكن

‏289 توكن في الثانية: ماذا يعني عمليًا

عند 289 توكن/ث، يولّد Gemini 3.5 Flash استجابة من 1,000 توكن في نحو 3.5 ثانية. ويستغرق GPT-5 عند 90 توكن/ث ‏11 ثانية للإخراج نفسه. وClaude Opus 4.8 عند 68 توكن/ث ‏15 ثانية. وزمن أول توكن حاسم بالقدر نفسه: 195 مللي ثانية لـFlash مقابل 520 لـGPT-5 و700 لـOpus 4.8.

في إطار وكلاء متوازٍ، تتراكم هذه الأفضلية في الإنتاجية. تستطيع تشغيل ثلاثة وكلاء Gemini 3.5 Flash ضمن زمن الجدار نفسه الذي يستغرقه وكيل GPT-5 واحد، وبتكلفة مقارِبة لكل مهمة. للخطوط التي تشغّل كثيرًا من المهام القصيرة بالتتابع أو تنفّذ حلقات استدلال متعدّدة الخطوات، تخفض سرعة Flash إجمالي زمن الخط مباشرةً.

التخزين المؤقت: أرخص سعر إدخال مخزَّن

الإدخال المخزَّن مؤقتًا يكلّف 0.15 دولار لكل مليون — خصم 90% عن السعر القياسي، يوازي خصم Anthropic. لوكيل بتعليمات نظام 100 ألف توكن مخزَّنة بمعدّل إصابة 90%: تهبط تكلفة الإدخال الفعّالة من 1.50 دولار لكل مليون إلى ‏0.15 × 0.9 + 1.50 × 0.1 = 0.135 + 0.15 = 0.285 دولار فعليًا لكل مليون. عند هذا السعر، يصبح Gemini 3.5 Flash أرخص الخيارات بين الواجهات المدفوعة الكبرى لأحمال الوكلاء الكثيفة التخزين.

الرؤية: أعلى درجة وسائط متعددة

درجة قدرة الرؤية في Gemini 3.5 Flash هي 92 — الأعلى بين كل النماذج المتابَعة هنا. يدعم أصيلًا مدخلات الصور وإطارات الفيديو والصوت ومستندات PDF عبر واجهة Gemini. للخطوط التي تعالج لقطات شاشة أو صور منتجات أو مستندات ممسوحة أو محتوى فيديو، هذا هو الافتراضي العملي. DeepSeek V4-Pro بلا رؤية. وGPT-5 وOpus 4.8 يدعمان الصور لكن بدرجة أدنى (85–86).

ربط بحث Google: وصول حيّ أصيل للويب

Gemini 3.5 Flash هو النموذج الوحيد في هذه المقارنة الذي يملك ربط بحث Google أصيلًا كأداة API. حين يُفعَّل الربط، يسترجع النموذج نتائج ويب حيّة ويدمجها في الاستجابة — فيقلّل الهلوسة في الأسئلة الواقعية ويلغي الحاجة إلى خط RAG منفصل لأسئلة البيانات الحديثة. هذه قدرة فريدة: ليست وصولًا تقريبيًا للويب عبر استدعاء الدوال، بل تكامل بحث فعلي على مستوى الـAPI.

الطبقة المجانية

يقدّم Gemini 3.5 Flash طبقة مجانية محدودة المعدّل: 15 طلبًا في الدقيقة، ومليون توكن في الدقيقة، و1,500 طلب في اليوم. للنماذج الأولية والأدوات الداخلية والتطبيقات منخفضة الحجم، تلغي الطبقة المجانية تكلفة البنية التحتية تمامًا أثناء التطوير. معظم تطبيقات الإنتاج تتجاوز هذه الحدود؛ ويسري السعر المدفوع من تلك النقطة.

سيناريوهات التكلفة

عند 10 ملايين إدخال + 3 ملايين إخراج شهريًا بالسعر القياسي: 15 + 27 = 42 دولارًا شهريًا — مطابق تقريبًا لـGPT-5 (42.50 دولار شهريًا). ومع إصابة تخزين 90% على الإدخال: 1.35 + 1.50 = 2.85 دولار إدخال + 27 دولارًا إخراج = 29.85 دولار شهريًا. مع التخزين المؤقت، يصبح Gemini 3.5 Flash أرخص فعليًا من GPT-5 عند الحجم المكافئ — مع ثلاثة أضعاف سرعة الإخراج ورؤية أصيلة. وسقف الإخراج (65 ألفًا مقابل 128 ألفًا لبقية النماذج) هو القيد الوحيد الذي يجب فحصه لحملك تحديدًا.

ملاءمة الاستخدام

الأنسب لـ: خطوط الوكلاء عالية الإنتاجية حيث زمن الاستجابة هو العائق؛ مهام الوسائط المتعددة التي تتطلب مدخلات صور أو فيديو أو مستندات؛ أي حمل يستفيد من ربط بحث Google؛ النماذج الأولية عبر الطبقة المجانية؛ تنفيذ الوكلاء بالتوازي حيث تكون ثلاثة أضعاف الإنتاجية أفضلية حقيقية.

تجاوزه إذا: احتجت أعمق استدلال برمجي في الاستدعاء الواحد — فـClaude Opus 4.8 (88.6% على SWE-bench) أقوى بوضوح؛ أو أنتج خطك مخرجات أطول من 65 ألف توكن (سقف الإخراج أدنى من معيار 128 ألفًا)؛ أو تطلّبت إقامة بيانات صارمة خارج بنية Google.

قائمة قرار

قبل التوجيه إلى Gemini 3.5 Flash: تحقّق من حد 65 ألف توكن للإخراج مقابل أطول مخرجاتك المتوقعة. لمعظم المهام هذا كافٍ، لكن لتوليد الكود أو المستندات الطويلة قد يكون قيدًا صلبًا. وقِس زمن أول توكن من منطقة نشرك — توزيع Google الإقليمي ممتاز لكنه يتفاوت.

وإن كنت تقيّمه مقابل GPT-5 على التكلفة: شغّل المقارنة مع تفعيل التخزين المؤقت. سعر Gemini 3.5 Flash المخزَّن عند 0.15 دولار لكل مليون يجعله أرخص ماديًا من GPT-5 غير المخزَّن (1.25 دولار لكل مليون) للأحمال الكثيفة التخزين.

أسئلة متكررة

هل الطبقة المجانية مفيدة للإنتاج؟

مصمَّمة للنماذج الأولية لا للإنتاج. حدودها: 15 طلبًا في الدقيقة، مليون توكن في الدقيقة، 1,500 طلب في اليوم. معظم تطبيقات الإنتاج تتجاوزها بسرعة. استعملها للتطوير والاختبار، وانتقل إلى المدفوع لأي حركة جدّية.

عند 289 توكن/ث، كم وكيلًا أشغّل بالتوازي؟

نحو ثلاثة أضعاف GPT-5 (‏90 توكن/ث) لزمن الجدار نفسه. استجابة من 1,000 توكن: Flash في نحو 3.5 ثانية، GPT-5 في نحو 11، Claude Opus 4.8 في نحو 15. في الأطر المتوازية، يضاعف هذا الإنتاجية بتكلفة مقارِبة لكل مهمة.

هل يدعم Gemini 3.5 Flash ربط بحث Google؟

نعم. ربط البحث الأصيل متاح كأداة API — النموذج الوحيد في هذه المقارنة بوصول حيّ للويب مدمَج في طبقة الـAPI. للأسئلة الواقعية التي تتطلب بيانات حديثة، يلغي الربط الحاجة إلى خط RAG منفصل.

سجل التغييرات

  • — نُشرت النسخة العربية مع تحليل السرعة الكامل، واقتصاديات التخزين المؤقت، وتفصيل الرؤية، وربط البحث، وسيناريوهات التكلفة.

المصادر

  • تسعير Google AI Gemini — ai.google.dev/pricing (محقّق يونيو 2026)
  • لوحة SWE-bench Verified — swebench.com (درجة البنشمارك لهذا النموذج تقديرية)
  • ملف benchr model-figures.json — محقّق يونيو 2026