التصنيفات · محدَّث يوليو 2026

ترتيب نماذج الذكاء الاصطناعي

29 نموذجًا من الفئات المتقدمة والمتوسطة ومفتوحة الأوزان. يبدأ الجدول بعدسة القدرة، ويمكنك اختيار القيمة لإدخال أسعار API المنشورة في الحساب. درجات القدرة والسرعة تقديرات تحريرية، وليست نتائج مختبر مستقل.

البيانات من models.json طريقة الحساب منشورة · لا ترتيب مدفوع

نماذج الذكاء الاصطناعي مرتّبة بتقييم benchr
#	النموذج	تقييم benchr	SWE-bench %	إدخال $/مليون	إخراج $/مليون	السياق	توكن/ث	الإصدار
جارٍ تحميل النماذج…

كيف يعمل تقييم benchr

يتغير معنى الدرجة حسب خيار الترتيب. وضع القدرة يقارن ما يستطيع النموذج فعله من دون احتساب السعر. وضع القيمة يضيف كفاءة أسعار API المنشورة. طريقة الحساب منشورة، لكن جزءًا من الدرجة تحريري؛ تعامل معها كأداة فرز لا كقياس مختبري.

القدرة — الافتراضي

درجة قدرة تستخدم التوليفة نفسها في بقية الموقع. تُبنى من نتائج الاختبارات والسجل العام، ويمكنك فحصها في models.json؛ وليست مأخوذة من مواد تسويقية.

القدرة = (البرمجة × 0.40) + (الاستدلال × 0.40) + (الكتابة × 0.20)

القيمة — عدسة اختيارية

تجمع هذه العدسة القدرة مع كفاءة سعر API. السعر هو متوسط الإدخال والإخراج لكل مليون توكن. النموذج المستضاف ذاتيًا الذي لا يملك سعر API لكل توكن يحصل على أعلى درجة سعر؛ ولا تشمل المقارنة تكلفة العتاد أو التشغيل أو الاستضافة، لذلك لا تمثل التكلفة الكلية.

المخلوط = (سعر الإدخال + سعر الإخراج) / 2 درجة السعر = max(0, min(100, 100 × (1 − max(0, المخلوط − 0.50) / 29.50))) درجة القيمة = round(القدرة × 0.65 + درجة السعر × 0.35)

المعادلتان تعملان في models.ar.js فتقرأهما وتتحقق منهما بنفسك. كلٌّ تنتج قيمة 0–100 معروضة على مقياس 0–10، والسعر معروض في عمودَي الإدخال/الإخراج في الوضعين. للأرقام الرسمية المحقّقة راجع model-figures.json.

أسئلة متكررة

ما تقييم benchr؟

يبدأ الجدول بدرجة القدرة التي تجمع البرمجة والاستدلال والكتابة. ويحوّل خيار «القيمة» الترتيب إلى عدسة تدخل فيها كفاءة السعر. يمكنك مراجعة المعادلة في models.ar.js، كما تظهر الأسعار في أعمدة مستقلة.

أي نموذج هو الأفضل في 2026؟

يعتمد على المهمة والميزانية. ترتيب «القدرة» تحريري، بينما يضيف ترتيب «القيمة» الأسعار المدرجة. استخدم الجدول لاختيار مجموعة صغيرة، ثم اختبرها على عمل يشبه استخدامك. لا تثبت أي درجة هنا وجود فائز عام.

هل التصنيفات مدفوعة؟

لا. تُحسب بالكامل من البيانات في models.json، ولم يدفع أي مزوّد مقابل موضعه. راجع المعايير التحريرية.

لماذا تُوصَف بعض نتائج الاختبارات بأنها «تقديرات تحريرية»؟

كثير من نتائج الاختبارات غير قابل للمقارنة مباشرة بين المزوّدين؛ فمجموعات الاختبار والظروف تختلف، وبعض الأرقام يبلّغها المزوّد بنفسه. راجع model-figures.json للأرقام الموثقة ومصادرها.

أدوات أخرى

فهرس الأسعار ←أسعار كل النماذج بالعربي، مرتّبة بالتكلفة حاسبة التكلفة ←أدخل استهلاكك من التوكن واحصل على التكلفة الشهرية مقارنة جنبًا لجنب ←اختر حتى خمسة نماذج وقارن كل بُعد