دليل التسعير·يونيو 2026

تسعير Llama 4 Scout: سياق عشرة ملايين توكن وأوزان مفتوحة

تذكر Meta أن سياق Llama 4 Scout يصل إلى عشرة ملايين توكن. هذا الحد قد يفيد مع قواعد الكود وأرشيفات المستندات الكبيرة، لكنه لا يتاح بالضرورة كاملًا لدى كل مزوّد. الأوزان متاحة للتنزيل وفق رخصة Llama 4، أما سعر الواجهة فيحدده مزوّد الاستدلال.

من فريق benchr · محدَّث 29 يوليو 2026 · رُوجعت قدرات النموذج والرخصة مقابل بطاقة Meta الرسمية، ووُسم سعر المزوّد بتاريخ اللقطة · سجل التغييرات

الرخصةرخصة Llama 4 محدودة بلا إتاوة

الإدخال / مليونTogether.ai في 29 يوليو

السياقحد Meta المعلن

نسبة السياقمقابل Gemini 3.1 Pro

خيارات التسعير

llama-4-scout — خيارات التسعير
الخيار	الكلفة
استضافة ذاتية (أوزان Meta)	العتاد والتشغيل
إدخال Together.ai	0.18 دولار/مليون
إخراج Together.ai	0.59 دولار/مليون
سعة السياق	10,000,000 توكن

ماذا يعني سياق عشرة ملايين توكن عمليًا؟

يعادل عشرة ملايين توكن آلاف الصفحات، لكن عدد الصفحات ليس وحدة ثابتة؛ فاللغة والتنسيق والكود تغيّر طريقة التقطيع إلى توكنات. قد يقلّل هذا الحد الحاجة إلى تقسيم مستودع كبير أو أرشيف مستندات، بشرط أن يتيح النشر الطول الكامل وأن تحافظ جودة الاسترجاع على المستوى المطلوب.

لا تبدأ بتصميم النظام حول الرقم الأقصى. قِس أطول الطلبات الحقيقية، واختبر الدقة والسرعة والذاكرة عند تلك الأطوال. إذا كانت غالبية الطلبات أقصر بكثير، فقد يكون نموذج بسياق أصغر وجودة أعلى أو تشغيل أبسط خيارًا أفضل.

Scout مقابل Maverick: مقايضة السياق والجودة

يمنح Scout حد سياق أكبر، بينما حقق Maverick نتائج أعلى في عدد من اختبارات Meta المنشورة. يدعم النموذجان النصوص والصور، فلا يكفي نوع المدخلات للفصل بينهما. اختبر المهمة نفسها على النموذجين، ثم قارن الجودة والسرعة والذاكرة وحد السياق المتاح في بيئة التشغيل.

العتاد للاستضافة الذاتية

لدى Scout ‏109B معلمة إجمالية. تحتاج الأوزان وحدها حسابيًا إلى نحو 218GB عند BF16 ونحو 54.5GB عند تعبئة مثالية على أربع بتات، قبل بيانات التكميم وذاكرة التشغيل ومخزن KV. وتقول Meta إن نسخة Int4 تلائم بطاقة H100 واحدة، لكن هذا لا يعني أن طلبًا بطول عشرة ملايين توكن سيلائمها أيضًا. احسب ذاكرة السياق والتزامن وعبء منظومة الخدمة، ثم اختبر الطول المطلوب تحت حمل واقعي.

سيناريوهات التكلفة

بحسب سعر Together.ai المنشور في 29 يوليو 2026، فإن 5 ملايين توكن إدخال ومليون توكن إخراج تساوي 0.90 + 0.59 = 1.49 دولار شهريًا. هذه حسبة توكنات فقط؛ لا تشمل التخزين أو الاسترجاع أو المراقبة أو الضرائب. كما أن صفحة المزوّد تعرض سياقًا يبلغ مليون توكن، لا حد Meta الكامل.

ملاءمة الاستخدام

مرشح لـ: تحليل قواعد كود أو أرشيفات مستندات تتجاوز حدود السياق المعتادة، أو جلسات طويلة ثبت بالاختبار أنها تستفيد من الاحتفاظ بمواد أكثر في الطلب نفسه.

قارن بدائل إذا: كانت طلباتك الفعلية أقصر من مليون توكن، أو كانت جودة الاستدلال والسرعة أهم من الحد الأقصى، أو احتجت خدمة مُدارة باتفاقية مستوى خدمة لا يوفرها مزوّد Scout. ويدعم Scout الصور؛ اختبر جودة الرؤية بدل استبعاده على أساس نوع المدخلات.

قائمة قرار

راجع أطول الطلبات الفعلية، لا متوسطها وحده. إن كانت معظمها دون 500 ألف توكن، فقارن Scout بخيارات أبسط في التشغيل. يصبح حد العشرة ملايين ذا قيمة حين تتجاوز المهام مليون توكن بانتظام وتثبت الاختبارات أن الاحتفاظ بالسياق الإضافي يحسن النتيجة.

تحقّق من دعم المزوّد قبل بناء معمارية تعتمد على نافذة العشرة ملايين الكاملة. والاستضافة الذاتية لا تضمن السقف بدورها: احسب ذاكرة الأوزان ومخزن KV وعبء بيئة التشغيل والتزامن، ثم أعد إنتاج الطول المستهدف تحت الحمل.

أسئلة متكررة

ما فائدة سياق عشرة ملايين توكن في Llama 4 Scout؟

قد يقلّل هذا الحد الحاجة إلى تقسيم قواعد الكود أو أرشيفات المستندات الكبيرة، لكنه لا يعني أن كل طلب سيحتاج السعة كاملة. يعتمد ما يتسع على طريقة احتساب التوكنات، وحد المزوّد، وذاكرة النشر، كما يجب اختبار جودة الاسترجاع عند الطول المستهدف.

كيف أختار بين Llama 4 Scout وLlama 4 Maverick؟

يمنح Scout حد سياق أكبر، بينما حقق Maverick نتائج أعلى في عدد من اختبارات Meta المنشورة. يدعم النموذجان النصوص والصور. اختبرهما على المهمة نفسها، ثم قارن الجودة والسرعة وحد السياق المتاح وكلفة التشغيل.

هل سعر 0.18 دولار لـLlama 4 Scout سعر رسمي من Meta؟

لا. هذا سعر إدخال تعرضه صفحة Together.ai عند تاريخ المراجعة، وليس سعرًا صادرًا من Meta. تعرض الصفحة نفسها حد سياق يبلغ مليون توكن، وهو أقل من حد Meta المعلن البالغ عشرة ملايين؛ لذلك تحقّق من السعر والحد لدى مزوّدك.

سجل التغييرات

29 يوليو 2026 — صُحح وصف Scout إلى نموذج متعدد الوسائط، وحُدث سعر Together.ai إلى 0.18/0.59 دولار مع توثيق حد المزوّد البالغ مليون توكن، وأعيدت صياغة تقديرات السياق والنشر دون وعود مطلقة.
24 يوليو 2026 — صُححت تقديرات ذاكرة الدقة الكاملة والتكميم، وفُصل اتساع الأوزان على بطاقة واحدة عن متطلبات مخزن KV لطلب بطول عشرة ملايين توكن، وصُحح وصف الرخصة إلى أوزان مفتوحة.
12 يونيو 2026 — نُشرت النسخة العربية مع تحليل سياق العشرة ملايين، ومقارنة Scout مقابل Maverick، وتوضيح غياب سعر API الرسمي، ومتطلبات العتاد، وسيناريوهات التكلفة.

المصادر

بطاقة Llama 4 Scout الرسمية من Meta — الوسائط والسياق والمعلمات والرخصة (رُوجعت 29 يوليو 2026)
صفحة Llama 4 Scout لدى Together.ai — سعر 0.18/0.59 دولار وحد سياق مليون توكن (رُوجعت 29 يوليو 2026)
ملف benchr models.json — محقّق يونيو 2026