تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $0.14 |
| إخراج قياسي | $0.28 |
| إدخال مخزَّن مؤقتًا | $0.0028 |
| سعة السياق | 1,000,000 توكن |
موقع التكلفة مقابل الجودة
يسجّل DeepSeek V4-Flash 79% على SWE-bench Verified — بفارق 0.6 نقطة عن 79.6% لـClaude Sonnet 4.6، وأكثر من 4 نقاط فوق 73.3% لـClaude Haiku 4.5. وفرق التسعير مذهل: يكلّف Sonnet 4.6 3 دولارات للمليون إدخال (أغلى 21 ضعفًا)، ويكلّف Haiku 4.5 1 دولار (أغلى 7 أضعاف). على الورق، يقدّم V4-Flash برمجة بطبقة Sonnet بأسعار Haiku أو أرخص. التحفّظ العملي أن SWE-bench بنشمارك لا ضمانة للأداء على توزيع مهامك تحديدًا — شغّل تقييمك الخاص قبل تحويل حركة الإنتاج.
رخصة MIT والاستضافة الذاتية
أوزان DeepSeek V4-Flash مرخّصة برخصة MIT — مفتوحة المصدر بالكامل وقابلة للاستعمال التجاري دون قيد. للفرق التي تملك وصولًا إلى وحدات A100 أو H100، تلغي الاستضافة الذاتية تكلفة الـAPI كليًا. وعند 0.14 دولار للمليون عبر الـAPI، تقع نقطة التعادل للاستضافة الذاتية عند حجم مرتفع ومستدام — قرابة 500 مليون توكن شهريًا فأكثر، حيث تبدأ تكاليف البنية التحتية تنافس رسوم الـAPI. دون هذه العتبة، يكون الـAPI عادةً أرخص من صيانة سعة GPU مخصّصة. وفوقها، توفّر الاستضافة الذاتية يقينًا في التكلفة وتزيل هواجس إقامة البيانات.
تسعير التخزين المؤقت: 0.0028 دولار لكل مليون
يكلّف الإدخال المخزَّن مؤقتًا في DeepSeek V4-Flash 0.0028 دولار للمليون — خصم 98% عن السعر القياسي البالغ 0.14 دولار. لخطوط معالجة الوكلاء ذات أنظمة البرومبت الكبيرة المتكررة، تبلغ تكلفة الإدخال الفعّالة مع استغلال مرتفع للتخزين المؤقت نحو 0.017 دولار للمليون عند معدّل إصابة 90%. بهذا السعر، تصبح تكلفة الإدخال مهملة عمليًا لمعظم تصاميم خطوط المعالجة.
سيناريوهات التكلفة
عند 50 مليون توكن إدخال + 15 مليون إخراج شهريًا: 7 دولارات + 4.20 دولار = 11.20 دولار شهريًا. وClaude Sonnet 4.6 عند الحجم نفسه: 150 دولارًا + 225 دولارًا = 375 دولارًا شهريًا — أغلى 33 ضعفًا. وعند 500 مليون إدخال + 150 مليون إخراج — أي حجم إنتاج كبير: يكلّف DeepSeek V4-Flash 70 دولارًا + 42 دولارًا = 112 دولارًا شهريًا. التوفير مقارنة بـSonnet عند الحجم الكبير (1,500 دولار + 2,250 دولارًا = 3,750 دولارًا) ليس طفيفًا — إنه تحويلي للفرق الهندسية المقيَّدة بالتكلفة.
ملاءمة الاستخدام
الأنسب لـ: أتمتة برمجة عالية الحجم حين تكفي 79% على SWE-bench؛ الشركات الناشئة الحسّاسة للتكلفة حيث يكون تسعير Sonnet مانعًا؛ النشر المستضاف ذاتيًا على بنية GPU قائمة؛ خطوط المعالجة الدفعية حيث لا يهمّ زمن الاستجابة إلى الصين.
تجاوزه إذا: كان زمن الاستجابة إلى واجهة DeepSeek الصينية قيدًا على تطبيقات فورية تواجه المستخدم. وتجاوزه أيضًا حين تُطلب جودة برمجة طليعية (88%+ على SWE-bench) — حينها يكون DeepSeek V4-Pro عند 0.43 دولار أو Claude Opus 4.8 عند 5 دولارات هما الترقية المناسبة.
قائمة قرار
قبل تحويل حركة البرمجة الإنتاجية إلى V4-Flash: شغّل تقييمًا أعمى على 100 مهمة من توزيع مهام البرمجة الخاص بك وقارن معدّلات النجاح مقابل Claude Sonnet 4.6. يقيس SWE-bench القدرة البرمجية العامة؛ وقد يُظهر مزيج مهامك تحديدًا فجوة جودة أكبر أو أصغر مما يوحي به البنشمارك.
راعِ متطلبات إقامة البيانات لديك: تمرّ واجهة DeepSeek عبر بنية تحتية صينية. لأحمال GDPR الأوروبية أو الحكومية الأمريكية ذات متطلبات الموقع، استعمل مزوّد استدلال مستضافًا في الولايات المتحدة أو استضف ذاتيًا على بنيتك التحتية.