تسعير Llama 4 Maverick: وسائط متعددة مفتوحة المصدر من Meta بسياق مليون توكن

‏Llama 4 Maverick هو النموذج الرائد مفتوح المصدر من Meta — وسائط متعددة (رؤية)، سياق مليون توكن، معمارية MoE. مجاني للاستضافة الذاتية تحت رخصة Llama Community License، أو نحو 0.20 دولار لكل مليون إدخال عبر مزوّدي الاستدلال الخارجيين. يأتي بقدرة وسائط متعددة بسياق مليون توكن إلى عمليات النشر ذاتية الاستضافة حيث تكون كلفة واجهات النماذج المغلقة باهظة.

من فريق benchr · · الأرقام محقّقة مقابل المصادر الرسمية، يونيو 2026 · سجل التغييرات

كلفة الرخصةمفتوح المصدر
الإدخال / مليونعبر Together.ai
السياقأقصى نافذة
الرؤيةإدخال صور

خيارات التسعير

llama-4-maverick — خيارات التسعير
الخيارالكلفة
استضافة ذاتية (أوزان Meta)البنية التحتية فقط
إدخال Together.ai~0.20 دولار/مليون
إخراج Together.ai~0.70 دولار/مليون
سعة السياق1,000,000 توكن

الحجّة للوسائط المتعددة مفتوحة المصدر

معظم واجهات الوسائط المتعددة — GPT-5 بالرؤية، Gemini 3.1 Pro، Claude Opus 4.8 — تتطلّب إرسال بيانات الصور إلى خوادم خارجية. للتطبيقات التي تعالج صورًا حسّاسة (تصوير طبي، صور منتجات خاصة، مستندات شخصية، تسجيلات كاميرات مراقبة) يخلق هذا اعتبارات إقامة بيانات وخصوصية. أما Llama 4 Maverick، مستضافًا ذاتيًّا على بنيتك التحتية، فيعالج الصور دون أي نقل بيانات خارجي. الفجوة في القدرة بين Maverick والوسائط المتعددة في النماذج المغلقة الرائدة حقيقية — لكن لكثير من مهام فهم الصور (التعرّف الضوئي على الحروف، تمييز المنتجات، قراءة المخططات، معالجة المستندات) تكفي الجودة، وميزة التحكّم في البيانات مقنِعة.

سياق مليون توكن: أين يهمّ

سعة سياق مليون توكن تستوعب نحو 750 صفحة نصًّا، أو مزيجًا مكافئًا من النص والصور. لنموذج مفتوح المصدر، هذا طول سياق استثنائي — فمعظم النماذج مفتوحة المصدر تتوقّف عند 32 ألفًا إلى 128 ألف توكن. الاستعمالات العملية: تحميل قاعدة كود كاملة مع توثيقها المرتبط في السياق لمراجعة معمارية؛ معالجة مجموعات مستندات متعدّدة دون تقطيع؛ جلسات وكلاء طويلة تحتاج الاحتفاظ بكامل سجل المحادثة دون اقتطاع. سياق المليون في Maverick يضاهي ما تقدّمه واجهات النماذج المغلقة الرائدة بسعر يتراوح بين دولارين وخمسة دولارات لكل مليون توكن.

اعتبارات العتاد والنشر

معمارية MoE في Llama 4 Maverick تتطلّب ذاكرة معالج رسومي كبيرة عند الدقة الكاملة — أربع بطاقات A100 سعة 80 غيغابايت أو ما يعادلها للخدمة الإنتاجية. ومع التكميم على أربع بتّات، تنخفض المتطلبات إلى نحو بطاقتي A100 سعة 40 غيغابايت. للفرق التي لا تملك بنية متعدّدة المعالجات الرسومية، يكون الاستدلال المستضاف خارجيًّا عبر Together.ai أو Fireworks.ai هو المسار العملي. وتصبح الاستضافة الذاتية مجدية اقتصاديًّا مقارنةً بالواجهات المغلقة عند أحجام مستدامة تتجاوز نحو 200 مليون توكن شهريًا على نسخ معالجات رسومية سحابية.

سيناريوهات التكلفة

عبر Together.ai عند 10 ملايين إدخال + 3 ملايين إخراج شهريًا: نحو 2 + 2.10 = ~4.10 دولار شهريًا. أما Gemini 3.1 Pro (وسائط متعددة، سياق مليوني توكن) بالحجم نفسه: 20 + 36 = 56 دولارًا شهريًا — أغلى بـ14 ضعفًا. للفرق التي يكفيها سقف جودة Llama لمهام الرؤية لديها، تكون الاقتصاديات تحويلية. التنبيه: جودة البنشمارك في مهام الرؤية تتأخّر عن النماذج المغلقة الرائدة، خصوصًا في الاستدلال المعقّد على الصور.

ملاءمة الاستخدام

الأنسب لـ: خطوط الوسائط المتعددة ذاتية الاستضافة حيث تهمّ إقامة بيانات الصور؛ التطبيقات طويلة السياق التي تحتاج مليون توكن بميزانية محدودة؛ الفرق التي تملك بنية معالجات رسومية قائمة وتريد تفادي كلفة واجهات الوسائط المتعددة؛ التطبيقات التي تكفيها أرضية جودة الرؤية مفتوحة المصدر (التعرّف الضوئي على الحروف، تصنيف المستندات، تمييز صور المنتجات).

تجاوزه إذا: تطلّبت مهام الرؤية لديك جودة استدلال رائدة — فهم مشاهد معقّد، تحليل صور طبية يتطلّب دقة عالية، أو أسئلة بصرية متطوّرة حيث تكون فجوات أداء النماذج المغلقة قابلة للقياس. تجاوزه أيضًا إن احتجت فيديو أو صوتًا (الدعم للصور فقط).

قائمة قرار

لمهام الرؤية: اختبر Llama 4 Maverick مقابل متطلبات فهم الصور لديك تحديدًا. التعرّف الضوئي على الحروف واستخراج المستندات المهيكَلة قويّان؛ أما استدلال المشاهد المعقّد ومهام التفاصيل البصرية الدقيقة فقد تُظهر فجوات مقابل Gemini 3.1 Pro أو GPT-5.5.

راجع شروط رخصة Meta لـLlama لحجم نشرك. عتبة الـ700 مليون مستخدم نشط ليست شاغلًا لمعظم الفرق، لكن قيد «لا يجوز تدريب نماذج منافِسة» قد يؤثّر في شركات منتجات الذكاء الاصطناعي.

أسئلة متكررة

ما الفرق بين Llama 4 Maverick وLlama 4 Scout؟

‏Maverick أكبر وأقدر (الاستدلال، جودة الرؤية، سياق مليون توكن). أما Scout فأخفّ وأسرع ويقدّم سياق عشرة ملايين توكن — أكبر نافذة متاحة للاسترجاع طويل السياق المتطرّف. اختر Maverick لجودة المهمة، وScout لسياق عشرة ملايين أو أقصى إنتاجية بميزانية محدودة.

ما متطلبات العتاد للاستضافة الذاتية لـLlama 4 Maverick؟

الدقة الكاملة: أربع بطاقات A100 سعة 80 غيغابايت أو بطاقتا H100. ومع التكميم على أربع بتّات: بطاقتا A100 سعة 40 غيغابايت. معمارية MoE تخفض المعاملات النشطة لكل استدلال فتدعم الإنتاجية. للبطاقة الواحدة، استعمل Llama 4 Scout أو متغيّرًا أصغر مكمَّمًا. نسخ المعالجات الرسومية السحابية المتعدّدة هي المسار الإنتاجي الأشيع.

هل على Llama 4 Maverick قيود استخدام تجاري؟

رخصة Llama Community License من Meta: الاستخدام التجاري متاح، الإسناد مطلوب، ولا يجوز تدريب نماذج لغوية عامة منافِسة، وفوق 700 مليون مستخدم نشط شهريًا يلزم ترخيص منفصل. ليس عائقًا لمعظم التطبيقات. تحقّق من الشروط الحالية على llama.meta.com/llama4.

سجل التغييرات

  • — نُشرت النسخة العربية مع حجّة الوسائط المتعددة مفتوحة المصدر، وتوضيح غياب سعر API الرسمي، ومتطلبات العتاد، ودليل الرخصة، وسيناريوهات التكلفة.

المصادر

  • ‏Meta Llama 4 — llama.meta.com (محقّق يونيو 2026)
  • تسعير Together.ai — together.ai/pricing (محقّق يونيو 2026)
  • ملف benchr models.json — محقّق يونيو 2026