تسعير Llama 4 Scout: سياق عشرة ملايين توكن — أكبر نافذة متاحة بنحو 0.11 دولار لكل مليون

‏Llama 4 Scout يحتلّ موقعًا فريدًا: أكبر سعة سياق في أي نموذج متاح — عشرة ملايين توكن — تكفي مستودعات برمجيات كاملة، أو أرشيفات مستندات متعدّدة السنوات، أو أي حمل طويل السياق لا يستطيع نموذج آخر معالجته في استدعاء واحد. أوزان مفتوحة مجانية من Meta، ونحو 0.11 دولار لكل مليون عبر واجهات الطرف الثالث.

من فريق benchr · · الأرقام محقّقة مقابل المصادر الرسمية، يونيو 2026 · سجل التغييرات

كلفة الرخصةمفتوح المصدر
الإدخال / مليونعبر Together.ai
السياقأقصى نافذة
نسبة السياقمقابل التالي الأكبر

خيارات التسعير

llama-4-scout — خيارات التسعير
الخيارالكلفة
استضافة ذاتية (أوزان Meta)البنية التحتية فقط
إدخال Together.ai~0.11 دولار/مليون
إخراج Together.ai~0.34 دولار/مليون
سعة السياق10,000,000 توكن

سياق عشرة ملايين توكن: ما الذي يفتحه فعلًا

عشرة ملايين توكن هي نحو 7,500 صفحة نصًّا. لنضعها بمنطق هندسي: قاعدة كود من مليون سطر مع توثيقها تتّسع بأريحية. عقد كامل من نصوص دعم العملاء. الأعمال الكاملة لمؤلِّف غزير الإنتاج عدة مرات. أما ثاني أكبر نافذة سياق تجارية — Gemini 3.1 Pro عند مليوني توكن — فتستوعب 1,500 صفحة. يستوعب Scout خمسة أضعاف ذلك. للتطبيقات التي كان القيد فيها دائمًا طول السياق — لا جودة الاستدلال — هذا فتح جوهري في القدرة.

عمليًّا: تستطيع شركة برمجيات تحميل قاعدة إنتاجها كاملة البالغة 800 ألف سطر، مضافًا إليها 200 ألف سطر من الاختبارات والتوثيق، في استدعاء سياق واحد لـScout. بلا تقطيع، بلا استرجاع، بلا فقدان للاستدلال عبر الملفّات من التجزئة. هذا ليس تحسينًا هامشيًّا على سياق المليونين — بل يتيح سير عمل كان مستحيلًا معماريًّا عند أحجام السياق الأصغر.

Scout مقابل Maverick: مقايضة السياق والجودة

‏Llama 4 Maverick هو نموذج الاستدلال الأمتن — أفضل على SWE-bench، أعمق في التحليل المعقّد، أقدر على مهام البنشمارك العامة. يقايض Scout عمق الاستدلال بطول السياق والإنتاجية. القرار ثنائيّ بناءً على متطلب السياق لديك: إن اتّسعت مهمتك في مليون توكن، فاستعمل Maverick لجودة أفضل بكلفة أعلى قليلًا. وإن تطلّبت مهمتك مليونين إلى عشرة ملايين توكن، فـScout هو الخيار الوحيد — لا بديل بهذا المدى من السياق، مفتوحًا كان أم مغلقًا.

العتاد للاستضافة الذاتية

معمارية MoE في Scout أخفّ من Maverick، بمعاملات نشطة أقلّ لكل خطوة استدلال. الدقة الكاملة تتّسع على نحو بطاقتي A100 سعة 40 غيغابايت؛ ومع التكميم، تكفي بطاقة A100 واحدة سعة 80 غيغابايت أو H100 لتشغيل الخدمة بإنتاجية معقولة. ولكي تكون نافذة العشرة ملايين توكن قابلة للاستعمال عمليًّا، تحتاج ذاكرة كافية لمخزَن KV — فمعالجة استدعاء سياق من عشرة ملايين توكن تتطلّب ذاكرة معالج رسومي كبيرة. عمليًّا، تستهدف معظم عمليات النشر ذاتية الاستضافة مدى السياق بين مليون ومليوني توكن حيث تكون متطلبات الذاكرة أيسر إدارةً.

سيناريوهات التكلفة

عند 5 ملايين إدخال + مليون إخراج شهريًا (معالجة مستندات طويلة): نحو 0.55 + 0.34 = ~0.89 دولار شهريًا عبر Together.ai. أما Gemini 3.1 Pro بالحجم نفسه (مدخلات دون 128 ألف توكن): 10 + 12 = 22 دولارًا شهريًا — أغلى بـ25 ضعفًا. اقتصاديات Scout مواتية إلى حدّ يجعل السؤال: هل فجوة الجودة على مهمتك تحديدًا تستحقّ فارق السعر بـ25 ضعفًا؟ للمهام التي تتطلّب تحديدًا سياق مليوني توكن فأكثر، لا بديل من Gemini — Scout هو الخيار الوحيد الصالح.

ملاءمة الاستخدام

الأنسب لـ: تحليل الكود على مستوى المستودع الكامل؛ معالجة أرشيفات المستندات متعدّدة السنوات؛ جلسات الوكلاء طويلة التشغيل التي يجب أن تحافظ على سياق كامل دون تلخيص؛ أي سير عمل يكون فيه سقف سياق المليونين للخيار التالي المتاح قيدًا صلبًا؛ الاسترجاع طويل السياق الحسّاس للكلفة حيث يُدخِل التقطيع فقدانًا في الترابط.

تجاوزه إذا: اتّسعت مهامك في سياق مليون توكن وكانت جودة الاستدلال أهمّ من سقف السياق — فـLlama 4 Maverick أو Gemini 3.1 Pro نموذجا استدلال أمتن. تجاوزه أيضًا لمهام الوسائط المتعددة (الصور) — فـScout نصّيّ فقط.

قائمة قرار

حدِّد متطلب طول السياق الفعلي عند المئوية 95. إن كان دون 500 ألف توكن، فـLlama 4 Maverick (سياق مليون، استدلال أمتن) هو الخيار الأفضل. لا تختر Scout إلا حين تكون لديك مهام تحتاج بانتظام مليون توكن فأكثر وتكون مقايضة جودة الاستدلال مقبولة.

تحقّق من دعم المزوّد: تواصل مع مزوّد الاستدلال لتأكيد أقصى طول سياق مدعوم قبل بناء معمارية تعتمد على نافذة العشرة ملايين الكاملة. والاستضافة الذاتية بعتاد مخصَّص هي المسار الموثوق إلى ميزة السياق الكاملة.

أسئلة متكررة

ماذا تفعل فعليًّا بسياق عشرة ملايين توكن؟

‏7,500 صفحة نصًّا، أو مستودع برمجيات ضخمًا كاملًا، أو أرشيفات مستندات متعدّدة السنوات، أو أي حمل طويل السياق لا يستطيع نموذج آخر معالجته في استدعاء واحد. لا تقدّم أي واجهة نموذج مغلق تجاري سياق عشرة ملايين توكن. الحالات: تحليل قاعدة كود كاملة بلا تقطيع، توليف متعدّد المستندات، جلسات وكلاء طويلة التشغيل.

هل Llama 4 Scout بقدرة Llama 4 Maverick نفسها؟

لا — Scout مُحسَّن لطول السياق والإنتاجية، لا لعمق الاستدلال. يسجّل Maverick أعلى في الاستدلال وSWE-bench. اختر Scout تحديدًا حين تحتاج سياق مليوني توكن فأكثر، واستعمل Maverick حين تكون جودة الاستدلال هي الأولوية ويكفي سياق المليون.

كيف يقارَن سياق Scout البالغ عشرة ملايين بسياق Gemini 3.1 Pro البالغ مليونين؟

‏Llama 4 Scout أكبر بخمسة أضعاف (عشرة ملايين مقابل مليونين). وبنحو 0.11 دولار لكل مليون إدخال عبر API، يكون Scout أرخص بنحو 18 ضعفًا من Gemini 3.1 Pro عند دولارين لكل مليون. للمهام التي تتطلّب سياق مليوني توكن فأكثر، Scout هو الخيار الوحيد. ويجب تقييم مقايضة جودة الاستدلال مقابل Gemini 3.1 Pro على توزيع مهامك تحديدًا.

سجل التغييرات

  • — نُشرت النسخة العربية مع تحليل سياق العشرة ملايين، ومقارنة Scout مقابل Maverick، وتوضيح غياب سعر API الرسمي، ومتطلبات العتاد، وسيناريوهات التكلفة.

المصادر

  • ‏Meta Llama 4 — llama.meta.com (محقّق يونيو 2026)
  • تسعير Together.ai — together.ai/pricing (محقّق يونيو 2026)
  • ملف benchr models.json — محقّق يونيو 2026