المواجهة المباشرة: راجع مراجعتنا التحريرية الكاملة في مراجعة DeepSeek V4-Pro، وموقع النموذج ضمن الفئة في طبقة النماذج مفتوحة المصدر الآن.
تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $0.435 |
| إخراج قياسي | $0.870 |
| إدخال مخزَّن مؤقتًا | $0.004 |
| سعة السياق | 1,000,000 توكن |
| أقصى إخراج | 384,000 توكن |
| الرخصة | MIT (قابلة للاستضافة الذاتية) |
فجوة التكلفة ليست طفيفة
عند حجم إنتاج متوسط — 10 ملايين توكن إدخال و3 ملايين إخراج شهريًا — تكون الأرقام صارخة: يكلّف DeepSeek V4-Pro 4.35 دولار + 2.61 دولار = 6.96 دولار شهريًا. وGPT-5 عند الحجم نفسه: 12.50 دولار + 30 دولارًا = 42.50 دولار شهريًا. وClaude Opus 4.8: 50 دولارًا + 75 دولارًا = 125 دولارًا شهريًا. أي أن DeepSeek يوفّر 84% مقابل GPT-5 و94% مقابل Opus 4.8 — عند سعة السياق نفسها وبنشمارك برمجة متقارب.
وعند 100 مليون توكن إدخال + 30 مليون إخراج، يتجاوز الفرق السنوي مقابل Claude Opus 4.8 حاجز 60 ألف دولار. لفريق مموَّل، هذا راتب مهندس كامل.
تخزين مؤقت بتكلفة تقارب الصفر
الإدخال المخزَّن مؤقتًا في DeepSeek V4-Pro يكلّف 0.004 دولار لكل مليون — خصم 99% عن سعر الإدخال القياسي. قارن: Anthropic تتقاضى 0.50 دولار للمليون المخزَّن (خصم 90%)، وGoogle 0.15 دولار (خصم 90%)، وOpenAI لا تنشر سعرًا للتخزين المؤقت في GPT-5 أصلًا. لأحمال الوكلاء ذات أنظمة البرومبت الكبيرة المتكررة، يخفّض التخزين المؤقت لدى DeepSeek تكلفة الإدخال إلى ما يشبه خطأ التقريب: نظام برومبت بحجم 100 ألف توكن مخزَّن في 9 من كل 10 استدعاءات يكلّف نحو 0.04 دولار إجمالًا لا 3.92 دولار.
أين يتفوّق DeepSeek V4-Pro
أقوى ما في النموذج هو ملف الرياضيات والاستدلال طويل السياق. على بنشمارك MATH: 96.1% — الأعلى بين كل النماذج المتتبَّعة هنا. وعلى GPQA Diamond (أسئلة علمية بمستوى الدراسات العليا): 90.1%، متقدّمًا على GPT-5.5. وعلى HumanEval: 93.5%. وعلى MMLU: 92.8%. هذه ليست أرقام نموذج اقتصادي.
كذلك يلفت حد الإخراج الأقصى عند 384 ألف توكن النظر: نحو ثلاثة أضعاف سقف 128 ألفًا لدى GPT-5 وGPT-5.5 وClaude. للأحمال التي تولّد مخرجات ضخمة — قواعد شيفرة كاملة، وثائق طويلة، مجموعات بيانات اصطناعية — يصنع هذا فرقًا عمليًا.
ما لا يستطيعه
لا يملك DeepSeek V4-Pro أي قدرة رؤية أو وسائط متعددة. إدخالات الصور غير مدعومة. إن كان خط معالجتك يلامس لقطات شاشة أو ملفات PDF تحوي رسومًا أو أي بيانات بصرية، فستحتاج نموذجًا مختلفًا لتلك الخطوة — Gemini 3.5 Flash (درجة رؤية 92) أو Claude Opus 4.8 (86).
كما تغيب اتفاقيات مستوى الخدمة المؤسسية، وإقامة البيانات داخل الولايات المتحدة، وتكاملات منظومة OpenAI أو Anthropic. للصناعات المنظَّمة أو فرق البنية التحتية ذات متطلبات معالجة البيانات الصارمة، تظل هذه القيود مهمة مهما بلغت ميزة السعر.
رخصة MIT ومسار الاستضافة الذاتية
أوزان DeepSeek V4-Pro متاحة علنًا تحت رخصة MIT. الاستضافة الذاتية على بنيتك التحتية الخاصة من وحدات المعالجة الرسومية تلغي رسوم الـAPI كليًا — لا تدفع إلا مقابل الحوسبة. للفرق التي تشغّل عناقيد GPU أصلًا، تقترب التكلفة الحدّية للاستدلال على نموذج نشرته بالفعل من الصفر. العائق العملي هو ذاكرة GPU: يتطلب النموذج الكامل ذاكرة VRAM كبيرة، وتحسين الاستدلال (التكميم، التجميع الدفعي) يستهلك وقت هندسة.
تبدأ معظم الفرق بالـAPI المستضاف ولا تقيّم حالة الاستضافة الذاتية إلا حين تتجاوز التكلفة الشهرية للـAPI الكلفة السنوية المكافئة لسعة GPU المطلوبة.
ملاءمة الاستخدام
الأنسب لـ: برمجة ورياضيات بمستوى الطليعة وبتكلفة منخفضة؛ معالجة الوثائق طويلة السياق؛ أحمال الوكلاء حيث يلغي التخزين المؤقت معظم تكلفة الإدخال؛ الإنتاج المستضاف ذاتيًا بإنفاق API يقارب الصفر.
تجاوزه إذا: احتجت رؤية أو إدخال صور؛ تطلّبت بنيتك إقامة بيانات داخل الولايات المتحدة أو اتفاقيات مستوى خدمة مؤسسية؛ كان فريقك متكاملًا بعمق مع منظومة OpenAI أو Anthropic وتجاوزت تكلفة الانتقال حجم التوفير.
الصياغة الصريحة: بنشمارك DeepSeek V4-Pro حقيقية لا منتقاة بعناية. النموذج ينافس فعلًا نماذج تكلّف 3 إلى 12 ضعفًا. حجّة التكلفة قوية إلى حدّ يجعل عبء الإثبات على أسباب عدم الاستخدام لا على أسباب الاستخدام.
قائمة قرار
قبل توجيه حركة إنتاج إلى DeepSeek V4-Pro: تأكّد أن حملك نصّي وبرمجي فقط (بلا إدخالات صور)؛ تحقّق من زمن الاستجابة من منطقة بنيتك التحتية إلى نقطة DeepSeek؛ شغّل تقييمًا صغيرًا على نوع مهمتك الفعلي — بنشمارك الرياضيات والبرمجة تنتقل جيدًا، لكن أسلوب اتّباع التعليمات يختلف عن نماذج OpenAI وAnthropic.
إن كنت تنتقل من GPT-5 أو Claude: اختبر توافق نظام البرومبت، وصيغة استدعاء الدوال، وسلوك وضع JSON. واجهة الـAPI متشابهة لا متطابقة. هجرة البرومبت تستغرق ساعات لخطوط المعالجة البسيطة، وأطول لوكلاء استخدام الأدوات المعقّدة.