تصنيف · محدَّث يونيو 2026

تصنيف أرخص API لنماذج الذكاء الاصطناعي

كل نموذج في فهرس benchr مرتّب حسب تكلفة التوكن المدمجة — الأرخص أولاً. النماذج مفتوحة المصدر التي بلا رسوم لكل توكن مُدرجة في الأعلى. البيانات من وثائق المزوّدين الرسمية، محدَّثة يونيو 2026.

البيانات من models.json مرجع محايد — لا مواضع مدفوعة أبداً
المرتبة النموذج المزوّد السعر المدمج $/1M الإدخال $/1M الإخراج $/1M
#1Qwen3.6-27BAlibabaاستضافة ذاتية (رخصة مجانية)استضافة ذاتيةاستضافة ذاتية
#2Llama 4 MaverickMetaاستضافة ذاتية (رخصة مجانية)استضافة ذاتيةاستضافة ذاتية
#3Llama 4 ScoutMetaاستضافة ذاتية (رخصة مجانية)استضافة ذاتيةاستضافة ذاتية
#4Phi-4Microsoftاستضافة ذاتية (رخصة مجانية)استضافة ذاتيةاستضافة ذاتية
#5DeepSeek V4-FlashDeepSeek$0.210$0.140$0.280
#6DeepSeek V4-ProDeepSeek$0.652$0.435$0.870
#7Mistral Large 3Mistral$1.00$0.500$1.50
#8GPT-5 MiniOpenAI$1.12$0.250$2.00
#9Grok 4.3xAI$1.88$1.25$2.50
#10Kimi K2.6Moonshot AI$2.48$0.950$4.00
#11Claude Haiku 4.5Anthropic$3.00$1.00$5.00
#12Mistral Medium 3.5Mistral$4.50$1.50$7.50
#13Gemini 3.5 FlashGoogle$5.25$1.50$9.00
#14GPT-5OpenAI$5.62$1.25$10.00
#15Gemini 3.1 ProGoogle$7.00$2.00$12.00
#16Claude Sonnet 4.6Anthropic$9.00$3.00$15.00
#17Claude Opus 4.8Anthropic$15.00$5.00$25.00
#18Claude Opus 4.7Anthropic$15.00$5.00$25.00
#19GPT-5.5OpenAI$17.50$5.00$30.00

كيف تعمل الفئة الاقتصادية في 2026

هبطت أسعار API أسرع مما توقعته معظم الفرق. غيّر DeepSeek V4-Flash السوق حين أُطلق بسعر $0.14/1M إدخال — أرخص بنحو 55% من GPT-5 Mini، متصدّر الفئة الاقتصادية السابق. ما زالت معظم الشركات لم تُحدّث نماذج تكلفتها لتأخذ في الحسبان مدى رخص قاع السوق اليوم.

النماذج في نطاق أقل من $1/1M إدخال ليست نماذج بدائية. يحقق DeepSeek V4-Flash 79.0% على SWE-bench. ويحقق GPT-5 Mini بسعر $0.25 نحو 48.0%. لقد انهارت العلاقة بين السعر والقدرة في الفئات الأدنى بطرق لم تكن صحيحة قبل عامين.

الاستضافة الذاتية مقابل API المُدار: المفاضلة الحقيقية

تظهر النماذج مفتوحة المصدر من Meta وAlibaba وMicrosoft بسعر $0 في هذا الجدول لأن رسوم رخصتها صفر. لكن هذا لا يعني أنها مجانية التشغيل. Llama 4 Scout — نموذج بـ 109 مليار معامل — يتطلب عدة خوادم GPU عالية الذاكرة للاستخدام الإنتاجي. عند أحجام الاستدعاء المنخفضة، يكون دفع $0.14/1M على API الخاص بـ DeepSeek أرخص من إبقاء خادم GPU عاملاً لخدمة نسختك الخاصة.

نقطة التعادل تقع تقريباً عند 200–400 مليون توكن يومياً بحسب النموذج وكفاءة بنيتك التحتية. تحت هذا الحد، تتفوق APIs المُدارة على إجمالي التكلفة حتى حين يسعّرها DeepSeek أو GPT-5 Mini بأجزاء من السنت لكل ألف توكن. وفوق هذا الحد، تستحق الاستضافة الذاتية تقييماً جدياً.

المنهجية

السعر المدمج = (سعر الإدخال + سعر الإخراج) / 2. تظهر النماذج بالاستضافة الذاتية بسعر مدمج $0 يعكس تكلفة رخصة صفرية؛ أما تكلفة البنية التحتية الفعلية فمستثناة. كل الأسعار مأخوذة من وثائق المزوّدين الرسمية، مُتحقَّق منها في 3 يونيو 2026. استخدم حاسبة التكلفة لنمذجة مزيج التوكنز الخاص بك.

متى لا يكون النموذج الأرخص هو الخيار الأرخص

السعر المنخفض للتوكن لا يفوز إلا حين يُنجز النموذج المهمة بمعدل إعادة محاولة مماثل وتكلفة مراجعة بشرية مماثلة. إذا أنتج نموذج أرخص توليدين فاشلين إضافيين مقابل كل إجابة ناجحة، فإن التوفير الظاهري يتلاشى بسرعة. قِس التكلفة لكل نتيجة مقبولة، لا التكلفة لكل توكن مُولَّد.

لتوجيه الإنتاج، استخدم هذا التصنيف كمرشّح أول، ثم شغّل تقييماً ضيقاً على مطالباتك الخاصة. الاختبار العملي بسيط: قارن نموذجاً اقتصادياً واحداً، ونموذجاً افتراضياً متوسطاً، ونموذجاً طليعياً على نفس الـ 100 إلى 300 مثال، ثم سعّر فقط المخرجات التي سيقبلها فريقك فعلاً.

وتيرة التحديث والتحقق

تُراجَع الأسعار في هذا الجدول مقابل وثائق المزوّدين حين يصدر نموذج كبير، أو حين يعلن مزوّد تغييراً في الأسعار، أو حين يُحدّث benchr فهرس النماذج المشترك. ولأن أسعار API قد تتغير بهدوء، يجب التعامل مع الجدول كأداة قرار، لا كعقد شراء. قبل توقيع اتفاق مزوّد طويل الأمد، راجع صفحة التسعير الحيّة للمزوّد وأي خصومات مؤسسية متاحة لحسابك.

يفصل الجدول أيضاً سعر التوكن عن ملاءمة المنصة. قد يكون نموذج هو الأرخص ويبقى مع ذلك خاطئاً لفريق يحتاج دعم SDK قائماً، أو مراجعة SOC، أو ضمانات منطقة سحابية، أو موافقة داخلية على مزوّد بعينه. تلك القيود تنتمي إلى ورقة تقييمك بجانب تكلفة التوكن.

أسئلة شائعة

ما أرخص API مستضاف لنماذج اللغة في 2026؟

DeepSeek V4-Flash بسعر $0.14 لكل مليون توكن إدخال و$0.28 لكل مليون توكن إخراج. وهو نموذج مفتوح المصدر برخصة MIT متاح أيضاً للاستضافة الذاتية. ومن بين النماذج التي لا يمكن الوصول إليها إلا عبر API مُدار، يحمل أدنى سعر لكل توكن بين النماذج القريبة من الطليعة.

هل النماذج مفتوحة المصدر بالاستضافة الذاتية مجانية؟

رسوم الرخصة صفر، لكن تكاليف الحوسبة ليست كذلك. تشغيل Llama 4 Scout أو Phi-4 يتطلب استئجار خوادم GPU. عند أحجام الاستدعاء المنخفضة، تكون APIs المستضافة أرخص غالباً. وعند الأحجام العالية المستمرة — مئات الملايين من التوكنز يومياً — تتفوق الاستضافة الذاتية عادةً على إجمالي التكلفة.

كيف يُحسب السعر المدمج؟

السعر المدمج هو (سعر الإدخال + سعر الإخراج) / 2، بافتراض مزيج متساوٍ من توكنز الإدخال والإخراج. معظم أحمال العمل الفعلية تميل إلى الإدخال أكثر، لذا تعامل مع السعر المدمج كتقدير متحفّظ لا كفاتورتك الفعلية.