تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $1.50 |
| إخراج قياسي | $9.00 |
| إدخال مخزَّن مؤقتًا | $0.15 |
| الطبقة المجانية | متاحة (بحدود معدّل) |
| سعة السياق | 1,048,576 توكن |
| أقصى إخراج | 65,536 توكن |
289 توكن في الثانية: ماذا يعني عمليًا
عند 289 توكن/ث، يولّد Gemini 3.5 Flash استجابة من 1,000 توكن في نحو 3.5 ثانية. ويستغرق GPT-5 عند 90 توكن/ث 11 ثانية للإخراج نفسه. وClaude Opus 4.8 عند 68 توكن/ث 15 ثانية. وزمن أول توكن حاسم بالقدر نفسه: 195 مللي ثانية لـFlash مقابل 520 لـGPT-5 و700 لـOpus 4.8.
في إطار وكلاء متوازٍ، تتراكم هذه الأفضلية في الإنتاجية. تستطيع تشغيل ثلاثة وكلاء Gemini 3.5 Flash ضمن زمن الجدار نفسه الذي يستغرقه وكيل GPT-5 واحد، وبتكلفة مقارِبة لكل مهمة. للخطوط التي تشغّل كثيرًا من المهام القصيرة بالتتابع أو تنفّذ حلقات استدلال متعدّدة الخطوات، تخفض سرعة Flash إجمالي زمن الخط مباشرةً.
التخزين المؤقت: أرخص سعر إدخال مخزَّن
الإدخال المخزَّن مؤقتًا يكلّف 0.15 دولار لكل مليون — خصم 90% عن السعر القياسي، يوازي خصم Anthropic. لوكيل بتعليمات نظام 100 ألف توكن مخزَّنة بمعدّل إصابة 90%: تهبط تكلفة الإدخال الفعّالة من 1.50 دولار لكل مليون إلى 0.15 × 0.9 + 1.50 × 0.1 = 0.135 + 0.15 = 0.285 دولار فعليًا لكل مليون. عند هذا السعر، يصبح Gemini 3.5 Flash أرخص الخيارات بين الواجهات المدفوعة الكبرى لأحمال الوكلاء الكثيفة التخزين.
الرؤية: أعلى درجة وسائط متعددة
درجة قدرة الرؤية في Gemini 3.5 Flash هي 92 — الأعلى بين كل النماذج المتابَعة هنا. يدعم أصيلًا مدخلات الصور وإطارات الفيديو والصوت ومستندات PDF عبر واجهة Gemini. للخطوط التي تعالج لقطات شاشة أو صور منتجات أو مستندات ممسوحة أو محتوى فيديو، هذا هو الافتراضي العملي. DeepSeek V4-Pro بلا رؤية. وGPT-5 وOpus 4.8 يدعمان الصور لكن بدرجة أدنى (85–86).
ربط بحث Google: وصول حيّ أصيل للويب
Gemini 3.5 Flash هو النموذج الوحيد في هذه المقارنة الذي يملك ربط بحث Google أصيلًا كأداة API. حين يُفعَّل الربط، يسترجع النموذج نتائج ويب حيّة ويدمجها في الاستجابة — فيقلّل الهلوسة في الأسئلة الواقعية ويلغي الحاجة إلى خط RAG منفصل لأسئلة البيانات الحديثة. هذه قدرة فريدة: ليست وصولًا تقريبيًا للويب عبر استدعاء الدوال، بل تكامل بحث فعلي على مستوى الـAPI.
الطبقة المجانية
يقدّم Gemini 3.5 Flash طبقة مجانية محدودة المعدّل: 15 طلبًا في الدقيقة، ومليون توكن في الدقيقة، و1,500 طلب في اليوم. للنماذج الأولية والأدوات الداخلية والتطبيقات منخفضة الحجم، تلغي الطبقة المجانية تكلفة البنية التحتية تمامًا أثناء التطوير. معظم تطبيقات الإنتاج تتجاوز هذه الحدود؛ ويسري السعر المدفوع من تلك النقطة.
سيناريوهات التكلفة
عند 10 ملايين إدخال + 3 ملايين إخراج شهريًا بالسعر القياسي: 15 + 27 = 42 دولارًا شهريًا — مطابق تقريبًا لـGPT-5 (42.50 دولار شهريًا). ومع إصابة تخزين 90% على الإدخال: 1.35 + 1.50 = 2.85 دولار إدخال + 27 دولارًا إخراج = 29.85 دولار شهريًا. مع التخزين المؤقت، يصبح Gemini 3.5 Flash أرخص فعليًا من GPT-5 عند الحجم المكافئ — مع ثلاثة أضعاف سرعة الإخراج ورؤية أصيلة. وسقف الإخراج (65 ألفًا مقابل 128 ألفًا لبقية النماذج) هو القيد الوحيد الذي يجب فحصه لحملك تحديدًا.
ملاءمة الاستخدام
الأنسب لـ: خطوط الوكلاء عالية الإنتاجية حيث زمن الاستجابة هو العائق؛ مهام الوسائط المتعددة التي تتطلب مدخلات صور أو فيديو أو مستندات؛ أي حمل يستفيد من ربط بحث Google؛ النماذج الأولية عبر الطبقة المجانية؛ تنفيذ الوكلاء بالتوازي حيث تكون ثلاثة أضعاف الإنتاجية أفضلية حقيقية.
تجاوزه إذا: احتجت أعمق استدلال برمجي في الاستدعاء الواحد — فـClaude Opus 4.8 (88.6% على SWE-bench) أقوى بوضوح؛ أو أنتج خطك مخرجات أطول من 65 ألف توكن (سقف الإخراج أدنى من معيار 128 ألفًا)؛ أو تطلّبت إقامة بيانات صارمة خارج بنية Google.
قائمة قرار
قبل التوجيه إلى Gemini 3.5 Flash: تحقّق من حد 65 ألف توكن للإخراج مقابل أطول مخرجاتك المتوقعة. لمعظم المهام هذا كافٍ، لكن لتوليد الكود أو المستندات الطويلة قد يكون قيدًا صلبًا. وقِس زمن أول توكن من منطقة نشرك — توزيع Google الإقليمي ممتاز لكنه يتفاوت.
وإن كنت تقيّمه مقابل GPT-5 على التكلفة: شغّل المقارنة مع تفعيل التخزين المؤقت. سعر Gemini 3.5 Flash المخزَّن عند 0.15 دولار لكل مليون يجعله أرخص ماديًا من GPT-5 غير المخزَّن (1.25 دولار لكل مليون) للأحمال الكثيفة التخزين.