الرسوم البيانية · محدَّث يونيو 2026

الرسوم البيانية لنماذج الذكاء الاصطناعي

طريقتان للعثور على النموذج المناسب. يُظهر الرسم المبعثر موقع كل نموذج على محور الذكاء مقابل السعر. ويتيح لك المستكشف إعادة وزن الأبعاد لتطابق حمل عملك الفعلي.

البيانات من models.json الترتيب محسوب من البيانات — لا مواضع مدفوعة أبداً

الذكاء مقابل السعر

كل نقطة نموذج. المحور الرأسي: درجة قدرة من 0–100 (البرمجة 40% + الاستدلال 40% + الكتابة 20%)، حيث البرمجة هي SWE-bench Verified والاستدلال هو GPQA Diamond — أرقام رسمية حيث نشرها المزوّد، وتقديرات benchr فيما عدا ذلك. المحور الأفقي: السعر المخلوط لكل مليون توكن (متوسط الإدخال + الإخراج). أعلى اليسار = أكبر قدرة لكل دولار. انقر أي نقطة لقراءة المراجعة.

نطاقات المحاور تتكيّف مع البيانات — لا نموذج مثبّت عند الحافة. الأسعار من وثائق المزوّدين الرسمية (يونيو 2026)؛ النماذج المجانية/بالاستضافة الذاتية مُزاحة قليلاً عن محور الـ $0 كي لا تتكدّس تسمياتها.

مستكشف البنشماركات

اسحب الأشرطة لوزن ما يهمّك. يتحدّث الترتيب فوراً. صفّر أي بُعد لا تكترث له — متاجر البرمجة فقط بإمكانها تصفير الكتابة وتعدد اللغات. وإن وزنت بُعداً لا يملك النموذج بيانات فيه (كالرؤية لنموذج نصّي فقط) فيُحتسب 0 هناك، ليعكس الترتيب أوزانك بصدق.

البرمجة 40%
الاستدلال 40%
الكتابة 20%
الرؤية 0%
سعة السياق 0%
تعدد اللغات 0%

جارٍ التحميل…

كيف تُحتسب هذه الدرجة. رقم كل نموذج متوسط موزون (0–100) للأبعاد التي ضبطتها أعلاه. البرمجة تستخدم SWE-bench Verified والاستدلال يستخدم GPQA Diamond — بنشماركات حقيقية موثّقة (أرقام رسمية حيث نشرها المزوّد، وتقدير benchr حيث لم ينشرها، بعلامة "تقديري"). أما الكتابة والرؤية وسعة السياق وتعدد اللغات فهي تقييمات تحريرية من benchr، لا بنشماركات مختبرية — راجع المنهجية. أي بُعد لا يملك النموذج بيانات فيه يُحتسب 0، ولا يُسقَط أبداً. الأشرطة مُقاسة إلى المتصدّر الحالي؛ والدرجات تظهر بخانة عشرية واحدة لتبقى النماذج المتقاربة متمايزة.

مفيد أيضاً

→ الفهرس المرتّب الكامل مع تقييم benchr → حاسبة التكلفة — التكلفة الشهرية الفعلية حسب الاستهلاك → مُوصِّي النماذج — أجب عن ثلاثة أسئلة → المقارنة جنباً إلى جنب

أسئلة شائعة

أي نموذج ذكاء اصطناعي يقدّم أفضل قدرة لكل دولار؟

في يونيو 2026: يتصدّر DeepSeek V4-Pro الرسم المبعثر — برمجة واستدلال قرب الصفّ الأول بأقل من $0.44/1M إدخال. يليه Gemini 3.5 Flash بقدرة متعددة الوسائط قوية بسعر $1.50/$9.00. كلاهما في منطقة "رخيص + قادر" أعلى اليسار.

ماذا يقيس المحور الرأسي (القدرة)؟

المحور الرأسي الافتراضي يستخدم البرمجة (40%) + الاستدلال (40%) + الكتابة (20%) من درجات القدرة التحريرية لدى benchr. استخدم الأشرطة في المستكشف لتغيير الوزن وفق حمل عملك.

لماذا تُرسم Llama/Phi عند سعر صفر؟

لأنها نماذج مفتوحة المصدر مجانية. إن استضفتها ذاتياً فتكلفة API هي $0 — تكلفتك بنية تحتية لا توكنز. وهذا يضعها عند الحافة اليسرى للرسم.

هل يمكنني تضمين هذه الرسوم أو مشاركتها؟

نعم. كل الرسوم تقرأ من ملف models.json العام. يمكنك تضمين أي صفحة أداة عبر iframe مباشرةً؛ وبيانات JSON حرة الاستخدام بموجب رخصة CC BY 4.0.

نشرة benchr

تغطية النماذج الجديدة يوم إطلاقها — الأسعار والبنشماركات وما الذي تغيّر.