تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي (≤200 ألف) | $2.00 |
| إدخال قياسي (>200 ألف) | $4.00 |
| إخراج قياسي | $12.00 |
| تخزين السياق المؤقت | $0.20 |
| سعة السياق | 1,000,000 توكن |
نافذة سياق المليون توكن — تطبيقات عملية
مليون توكن هي نحو 750 صفحة نصًّا، أو 150 إلى 200 صورة، أو ساعتين إلى ثلاث ساعات من تفريغ فيديو. يتيح هذا سير عمل غير عمليّ أو مستحيل مع النماذج الأصغر سياقًا: تحميل قاعدة كود كاملة من 50 ألف سطر في السياق لمراجعة معمارية؛ معالجة حزمة عقد قانوني كاملة؛ تحليل تسجيل فيديو من عدة ساعات في استدعاء واحد؛ توليف نتائج عبر 50 ورقة بحثية في آنٍ واحد. لأي مهمة يُدخِل فيها التقطيع فقدانًا في الترابط، تزيل نافذة المليون في Gemini 3.1 Pro القيد.
انتبه إلى التسعير المتدرّج: المدخلات فوق 200 ألف توكن تكلّف أربعة دولارات لكل مليون بدلًا من دولارين. للأحمال التي تستعمل بانتظام سياقًا بين 500 ألف ومليون توكن، تكون كلفة الإدخال الفعّالة لكل استدعاء أعلى — فخطّط ميزانيتك على هذا الأساس.
GPQA Diamond: 94.3% على علوم بمستوى الدكتوراه
يختبر GPQA Diamond أسئلة بمستوى الدكتوراه في الأحياء والكيمياء والفيزياء — أسئلة تتطلّب خبرة مجال تتجاوز مطابقة الأنماط. درجة Gemini 3.1 Pro البالغة 94.3% تتصدّر البنشمارك بين النماذج التجارية الكبرى، متقدّمةً على Claude Opus 4.8 عند 93.6% وعلى GPT-5.5. للمساعدة البحثية، والتحليل العلمي، والاستدلال الطبي، وفهم المستندات التقنية، يتّصل هذا المستوى من الأداء بجودة المهمة اتصالًا مباشرًا. أما للبرمجة عامة الغرض أو مهام الأعمال، فـGPQA أقلّ تمييزًا من SWE-bench.
وسائط متعددة أصيلة: فيديو، صوت، صور، PDF
يعالج Gemini 3.1 Pro النص والصور والفيديو والصوت وملفّات PDF في الاستدعاء نفسه. هذا مختلف معماريًّا عن إضافة الرؤية كأمر لاحق: تدرّب Google فهم الوسائط المتعددة من الأساس. سير عمل يتطلّب تحليل عرض تقني (PDF + شرائح + صوت) يمكن إرساله في استدعاء واحد. لذكاء المستندات، وتحليل الوسائط، ومهام البحث متعدّدة الوسائط، يكون Gemini 3.1 Pro أمتن عرض تجاري عند طبقته السعرية.
سيناريوهات التكلفة
عند 10 ملايين إدخال + مليوني إخراج شهريًا ضمن طبقات سياق 200 ألف: 20 + 24 = 44 دولارًا شهريًا. أما Claude Opus 4.8 بالحجم نفسه: 50 + 50 = 100 دولار شهريًا — Gemini أرخص بنسبة 56%. وللاستخدام طويل السياق (بمتوسّط 500 ألف توكن لكل استدعاء): 10 ملايين إدخال إجمالًا بأربعة دولارات/مليون مخلوطًا = 40 دولارًا + 24 دولارًا إخراجًا = 64 دولارًا شهريًا — ولا يزال أدنى بنسبة 36% من Opus 4.8 عند حجم الإخراج نفسه.
ملاءمة الاستخدام
الأنسب لـ: تحليل المستندات الطويلة التي تتطلّب أكثر من مليون توكن من السياق؛ البحث العلمي والاستدلال التقني حيث يهمّ تصدّر GPQA؛ خطوط الوسائط المتعددة التي تجمع النص والفيديو والصوت والصور؛ المنظومات المدمجة مع Google Cloud أو Vertex AI.
تجاوزه إذا: كانت حاجتك الأساسية أداء البرمجة على SWE-bench — فبنشمارك البرمجة لـGemini 3.1 Pro يتأخّر عن Claude Opus 4.8 وGPT-5.5. تجاوزه أيضًا للمهام الحجمية البسيطة حيث يكون السعر الأساس البالغ دولارين لكل مليون أعلى من اللازم — فـGemini 3.5 Flash عند 1.50 دولار لكل مليون يتولّى الأحمال الأخفّ.
قائمة قرار
حدِّد متطلبات طول السياق الفعلية لديك: إن كان سياقك عند المئوية 90 دون 200 ألف توكن، فنافذة المليون ليست عامل تمييز — وستظلّ كذلك في الطبقة السعرية الأرخص. وGemini 3.5 Flash عند 1.50 دولار لكل مليون يغطّي معظم المهام بكلفة أدنى. استعمل Gemini 3.1 Pro تحديدًا حين يكون سقف السياق أو فجوة أداء GPQA هو العائق.
للوسائط المتعددة: تأكّد ممّا إذا كانت أنماط إدخالك (فيديو، صوت) تستفيد فعلًا من المعمارية الأصيلة. لوصف الصور البسيط أو التعرّف الضوئي على حروف المستندات، تكفي نماذج أخفّ.