دليل·تحديث يوليو 2026

دليل عملي للنماذج مفتوحة الأوزان

مقارنة عملية بين Llama 4 وMistral Large 3 وDeepSeek-V4 وQwen3.6، مع نماذج أصغر ومتطلبات تشغيل كل فئة.

بقلم فريق benchr · تحديث 23 يوليو 2026

ماذا يغطي هذا الدليل

يغطي الدليل نماذج متقدمة مفتوحة الأوزان، منها Llama 4 وMistral Large 3 وDeepSeek-V4 وQwen3.6، إلى جانب نماذج أصغر مثل Phi-4 mini وGemma 3. كما يوضح متطلبات العتاد، ومتى تستحق الاستضافة الذاتية جهدها مقارنةً بواجهة API مُدارة.

النماذج المتقدمة مفتوحة الأوزان

مراجعة · يناير 2026
طبقة الأوزان المفتوحة الآن: Llama 4 وMistral وQwen وDeepSeek

قائمة مرشحين موثّقة من المزوّدين بعد إصدارات أبريل 2026. قارن شروط الرخصة ونتائج بطاقات النماذج وأعمال البرمجة واللغات ومتطلبات الذاكرة وتكلفة النشر، من دون افتراض فارق ثابت أمام النماذج المغلقة.

طبقة النماذج الصغيرة

مراجعة · فبراير 2026
النماذج اللغوية الصغيرة، في الاستخدام العملي

Phi-4 mini وGemma 3، وطريقة قابلة للتكرار لمعرفة إن كان نموذج دون 10B مناسباً لمهمة محددة. أنشئ مجموعة محجوبة وسجّل الدقة ونسبة المراجعة والكمون والذاكرة والتكلفة؛ فالصفحة لا تعرض نتيجة خاصة بنا.

تشغيلها بنفسك

مقالة · مارس 2026
تشغيل النماذج على جهازك الخاص

خطة قياس محلية عبر بيئات التشغيل ودرجات التكميم. سجّل النموذج والتكميم وبيئة التشغيل والشريحة وطول السياق والمطالبة والتوكنز في الثانية والطاقة والإشغال قبل مقارنة النشر المحلي بـAPI.

كيف تختار نموذجاً مفتوحاً؟

للحصول على مرشح إنتاج برخصة متساهلة، فكّر في Qwen3.6-27B. تحدد بطاقته الرسمية رخصة Apache 2.0 وتذكر 77.2% على SWE-bench Verified؛ وهذه نتيجة منشورة من Qwen وليست إعادة مستقلة لدى benchr. تحقّق محلياً من النسخة والتكميم وهامش VRAM وجودة اللغات.

إذا كانت البرمجة أو الرياضيات محور المهمة، وكانت شروط MIT الموثّقة تناسب استخدامك، فأدرج DeepSeek-V4. أرقام البنشماركات منشورة من DeepSeek؛ قارن النموذج بـQwen على مهام محجوبة بالطريقة نفسها، وتحقق من صفحة السعر قبل وضع الميزانية. لا يكفي الترتيب أو السعر وحده لاتخاذ القرار.

للتصنيف أو الاستخراج أو التوجيه، أدرج Phi-4 mini مرشحاً صغيراً بعد التحقق من النموذج والرخصة الرسميين. استخدم بيانات محجوبة وتعليمات وسياسة تصنيف ثابتة على جهازك المستهدف لقياس الدقة والامتناع والكمون والذاكرة وتكلفة المراجعة. ولا يدّعي هذا الدليل اختباراً خاصاً على بيانات بريد أو عتاد بعينه.

لمسألة التكلفة بين المفتوح والمغلق، راجع دليل تكاليف الذكاء الاصطناعي. قارن أسعار المزودين المؤرخة بإشغال GPU ووقت التشغيل والإعادات وعبء المراجعة والجودة المحجوبة لديك. لا توجد فجوة ثابتة في القدرة أو السعر؛ فهي تتغير مع عبء العمل وإعداد الخدمة والحجم وقاعدة التقييم.