النماذج مفتوحة المصدر: دليل

Llama 4 وMistral Large 3 وDeepSeek-V4 وQwen3.6، إضافةً إلى طبقة النماذج الصغيرة وما يلزم لتشغيلها بنفسك.

بقلم فريق benchr ·

ماذا يغطي هذا الدليل

يغطي هذا الدليل طبقة المصدر المفتوح في 2026: النماذج المفتوحة من الفئة المتقدمة (Llama 4 وMistral Large 3 وDeepSeek-V4 وQwen3.6)، وطبقة النماذج الصغيرة (Phi-4 mini وGemma 3 وإصدارات Phi الجديدة)، ومسألة العتاد — ماذا يلزم لتشغيل أيٍّ من هذه بنفسك، ومتى يكون ذلك القرار الصحيح بدلاً من الدفع مقابل API.

الطبقة المفتوحة المتقدمة

طبقة النماذج الصغيرة

تشغيلها بنفسك

  • مقالة · مارس 2026

    تشغيل النماذج على جهازك الخاص

    العتاد والبرمجيات وعدد التوكنز في الثانية الفعلي على ثلاثة مستويات تكميم. متى يستحق التشغيل المحلي مقابل الدفع لـ API. 220 tok/s لـ Phi-4 mini على M3 Max.

أي نموذج مفتوح ينبغي أن تستخدم؟

لمعظم أعمال الإنتاج التي تحتاج فيها إلى نموذج مفتوح المصدر برخصة متساهلة، يكون Qwen3.6-27B هو الخيار الافتراضي: Apache 2.0، ومدى واسع متعدد اللغات، و77.2% على SWE-bench Verified في بطاقته الرسمية، ويتسع على بطاقة رسومات واحدة.

إن كنت تحتاج أفضل أداء مفتوح المصدر في الرياضيات والكود وكانت قصة إقامة بياناتك تقبل بنود رخصة MIT، فإن DeepSeek-V4 يتفوّق على Qwen في تلك البنشماركات بالذات وهو أرخص نقطة وصول مُستضافة في الميدان — يبدأ V4-Flash من 0.14$ لكل مليون توكن مدخلات.

لأعمال النماذج الصغيرة (التصنيف والاستخراج والتوجيه)، ابدأ بـ Phi-4 mini (3.8B، MIT). يتسع في 16GB من الذاكرة، ويعمل بأكثر من 100 توكن في الثانية على حاسوب محمول استهلاكي، ويبلغ دقة 94% في اختبار تصنيف البريد مقابل خط أساس 96% لـ Sonnet 4.6.

لمسألة التكلفة بين المفتوح والمغلق، راجع دليل تكاليف الذكاء الاصطناعي. منذ إصدارات DeepSeek-V4 وQwen3.6 في أبريل 2026، تقع الطبقة المفتوحة على بُعد نقاط بنشمارك قليلة من النماذج المغلقة الرائدة وبأقل من عُشر سعر التوكن — والفجوة المتبقية في حلقات الوكلاء الطويلة والاسترجاع بالغ الضخامة، لا في الأرقام البارزة.