مسارات الوكلاء هي المكان الذي تموت فيه فواتير الرموز. وكيل برمجة يخطط ويستدعي الأدوات ويقرأ النتائج ويعيد المحاولة قد يحرق ملايين الرموز في تذكرة واحدة، والنموذج الذي تختاره يتضاعف مع كل خطوة. هذه المشكلة الاقتصادية هي بالضبط ما استهدفته Google بـ Gemini 3.5 Flash: نموذج سريع ورخيص بما يكفي ليجلس داخل مسار تشغله آلاف المرات يومياً، لكنه قوي بما يكفي ألا ينهار في الخطوات الصعبة. كن دقيقاً في كلمة “رخيص”. Gemini 3.5 Flash رخيص مقارنة بـ Pro ونماذج الاستدلال الرائدة. ليس رخيصاً مقارنة بطبقة Flash التي يستبدلها، والتي كانت تكلف نحو الثلث. “أرخص من Pro” و“رخيص” ادعاءان مختلفان، والأول فقط هو الصحيح.
جعلت Google هذا التوفر العام رسمياً في I/O في 19 مايو 2026، وهو مؤكد في سجل تغييرات Gemini API، والطرح محدد على نحو غير معتاد: هذا Flash يتفوق على الطبقة المميزة السابقة في المعايير التي تهتم بها Google، بسرعة Flash وتكلفة Flash. الأرقام أدناه من Google نفسها، فاقرأها مع هذا التحفظ. لكن شكل العرض واضح، وهو يغير حساب ما تستطيع أتمتته.
التسعير، بقراءة صريحة
ابدأ بالأرقام الرسمية، لأن كلمة التسويق “رخيص” تؤدي عملاً خفياً كثيراً. في الطبقة المدفوعة القياسية، وفق صفحة تسعير Gemini API من Google، يكلف Gemini 3.5 Flash $1.50 لكل مليون رمز إدخال و$9 لكل مليون إخراج. قراءة الإدخال المخبأ تنخفض إلى $0.15 لكل مليون، وتخزين التخزين المؤقت يكلف $1 لكل مليون رمز في الساعة. نفذ العمل نفسه عبر طبقة batch أو flex فينخفض السعر إلى النصف: $0.75 إدخال و$4.50 إخراج. توجد أيضاً طبقة مجانية: الإدخال والإخراج وتخزين السياق المؤقت بلا رسوم ضمن حدود المعدلات، ما يجعل بناء النموذج الأولي بلا تكلفة قبل الالتزام.
الآن حاجز الصراحة. ضع هذه الأسعار بجانب نماذج Flash السابقة. كان Gemini 3 Flash يدور حول $0.50 إدخال و$3 إخراج. وكان Gemini 2.5 Flash-Lite حول $0.10 إدخال و$0.40 إخراج. لذلك يكلف هذا الجيل من Flash نحو ثلاثة أضعاف سعر الإدخال في الجيل الذي سبقه، وأكثر من عشرة أضعاف Flash-Lite القديم. قال عدة معلقين الأمر بصراحة: Flash لم يعد طبقة الميزانية. ما تشتريه بهذا السعر الأعلى هو نموذج تزعم Google أنه في نقاش Pro من الجيل السابق، لا طبقة العمل الرخيصة جداً التي كان الاسم يوحي بها.
في مسارات الوكلاء، سعر الرمز نصف القصة فقط. تقول Google إن المهام غالباً تنتهي بأقل من نصف تكلفة طبقة Pro السابقة، جزئياً لأن النموذج أسرع وجزئياً لأن مستوى التفكير الافتراضي انخفض من “عالٍ” إلى “متوسط”، فينفق رموزاً أقل في التأمل في الخطوات الروتينية. رموز إخراج أقل لكل مهمة، بسعر إخراج أقل، تتراكم. حساب ما إذا كانت هذه الرياضيات تتفوق على بديل بسعر ثابت لمهمتك المحددة هو بالضبط سبب وجود تفصيل السعر حسب حالة الاستخدام في benchr، وإذا كانت مساراتك تنتفخ بسياقها الخاص، فإن تكتيكات خفض استخدام الرموز تهم هنا أكثر من نموذج تستدعيه مرة واحدة.
ما تقول Google إنه يستطيع فعله
حجة دفع أكثر من سعر Flash القديم تقوم على المعايير، وهذه نتائج طرف أول: Google أجرتها وGoogle تذكرها. قد تصل اللوحات المستقلة إلى مكان آخر، لذلك تعامل مع الجدول كأرقام بائع إلى أن تتدخل أطراف ثالثة. مع هذا التحفظ، الأرقام لافتة بالنسبة إلى نموذج Flash.
| المعيار | النتيجة | ما يقيسه |
|---|---|---|
| Terminal-Bench 2.1 | 76.2% | مهام برمجة ووكلاء داخل الطرفية |
| GDPval-AA | 1656 Elo | مهام وكلاء من العالم الحقيقي |
| MCP Atlas | 83.6% | موثوقية استخدام الأدوات |
| CharXiv Reasoning | 84.2% | فهم الرسوم متعددة الوسائط |
الخيط المشترك هو الوكلاء. Terminal-Bench وMCP Atlas يختبران ما إذا كان النموذج يستطيع قيادة الأدوات والتعافي من أخطائه عبر خطوات كثيرة، وهي نقطة الفشل التي تغرق النماذج الرخيصة في الإنتاج. نتيجة 76.2% على Terminal-Bench 2.1 و83.6% في موثوقية استخدام الأدوات هي من النوع الذي، إذا صمد خارج أدوات Google، يعني أنك تستطيع ترك المسار يستمر بدلاً من مراقبته. ورقم CharXiv يقول إنه يقرأ الرسوم والأشكال بكفاءة أيضاً، لذلك العمل الوكيلي متعدد الوسائط مطروح، لا النص فقط.
حدّان يجب إبقاؤهما في الصورة. تذكر Google ادعاء “أسرع 4x” أمام نماذج رائدة أخرى لكنها لم تنشر رقم رموز في الثانية مطلقاً، لذلك السرعة حقيقية وفق Google لكنها ليست مثبتة برقم صلب تبني عليه مواصفة. وحد المعرفة هو يناير 2025 في الوثائق الرسمية. قال ملخص خارجي واحد يناير 2026؛ الرقم الرسمي هو الذي تثق به، ما يعني أن أي شيء أحدث من أوائل 2025 يحتاج grounding عبر Search أو استرجاعك الخاص.
بماذا يتصل وأين يعمل
في العمل الوكيلي، قائمة الأدوات تهم بقدر المعايير. يدعم Gemini 3.5 Flash Google Search grounding وGrounding with Google Maps وFile Search وCode Execution وURL Context وFunction Calling. الفجوة اللافتة هي Computer Use، فهو غير مدعوم، لذلك إذا احتاج وكيلك النقر داخل شاشة بدلاً من استدعاء API، فهذا ليس النموذج لتلك الخطوة.
الوصول واسع منذ اليوم الأول. يحصل عليه المطورون عبر Gemini API في Google AI Studio وAndroid Studio وGoogle Antigravity، منصة Google الموجهة للوكلاء أولاً، إضافة إلى Vertex AI للإنتاج. وتحصل المؤسسات عليه عبر Gemini Enterprise وGemini Enterprise Agent Platform. ويلتقي به المستهلكون داخل تطبيق Gemini وAI Mode في Google Search. كما أن طبقة API المجانية تعني أنك تستطيع ربط مسار كامل واختباره بلا فاتورة، ثم الانتقال إلى الأسعار المدفوعة عندما يبرر الحجم ذلك.
الطرح ليس روبوت دردشة أذكى. بل نموذج رخيص وسريع بما يكفي لتتركه يعمل.
كيف يقف أمام البدائل
إذا كنت تختار داخل تشكيلة Google نفسها، فالمقارنة مع Gemini 3.1 Pro، والحساب مباشر: تقول Google إن Flash يتفوق عليه في معايير الوكلاء والبرمجة مع تكلفة أقل وسرعة أعلى، لذلك في عمل الوكلاء عالي الحجم يصبح Flash هو الافتراضي، ويصبح Pro النموذج الذي تصعّد إليه لأصعب استدلال. خارج Google، المنافس الطبيعي لمقعد الوكلاء الرخيص والقادر هو طبقة Anthropic الصغيرة. من يوازن هذا أمام Claude Haiku 4.5 يجب أن يقارن على المسار نفسه الذي يشغله، لأن موثوقية استخدام الأدوات وإنفاق الرموز لكل مهمة، لا سعر الملصق، هما ما يحددان الأرخص في الإنتاج.
النقطة الأوسع أن “Flash” كفئة صعدت إلى سوق أعلى. كان يعني أرخص ما تبيعه Google؛ الآن يعني الطرف الرخيص من الطبقة الرائدة. هذا التموضع الجديد هو سبب ارتفاع السعر، وهو سبب أن مجموعة المقارنة الصحيحة هي Pro والنماذج المتوسطة القادرة، لا نماذج الميزانية. إذا كانت حاجتك الحقيقية هي القاع المطلق في التكلفة، فهذا الجيل من Flash ليس هو.
الحكم النهائي
يستحق Gemini 3.5 Flash تقييمه بسبب ملاءمته. كنموذج تضعه داخل مسارات البرمجة والوكلاء طويلة الأفق، فإن مزيج معايير وكلاء تقول Google إنها تتفوق على Pro، وسرعة إخراج تقارب 4x، وسعر أقل من Pro، وطبقة مجانية للنمذجة الأولية، حزمة قوية، وتدعمها سعة 1M ومجموعة كاملة من التكاملات والأدوات. كون المعايير من الطرف الأول هو العلامة الرئيسية؛ انتظر اللوحات المستقلة قبل الرهان على مسار حرج على الأرقام الدقيقة.
اختر Gemini 3.5 Flash إذا كنت تشغل عملاً وكيلياً أو برمجياً عالي الحجم وكنت ستصل إلى نموذج Pro لا تحتاجه بدقة، لأنك هنا تحصل على معظم القدرة بتكلفة أقل وسرعة أعلى. تجاوزه إذا كان عبء عملك سعيداً على Flash القديم بنحو $0.50/$3 ولا يحتاج القوة الوكيلية الجديدة، لأن هذا ارتفاع سعر حقيقي لتلك الحالة. والتزم بنموذج استدلال رائد عندما تكون المهمة استدلالاً صعباً بضربة واحدة لا مسار خطوات متوسطة، حيث تتفوق القدرة الخام على اقتصاديات الإنتاجية. للعمل الذي بُني من أجله، هذا أحد أفضل المقاعد قيمة على اللوحة الآن.