تسعير DeepSeek V4-Pro: أرخص طليعة في السوق

عند 0.435 دولار لكل مليون توكن إدخال، يقدّم DeepSeek V4-Pro أداء طليعيًا في البرمجة والرياضيات بسعر يجعل كل واجهة أخرى تبدو باهظة. المقايضة محدّدة وواضحة: لا رؤية، بنية تحتية صينية، ومنحنى تعلّم للاستضافة الذاتية إن أردت تكلفة حدّية تقترب من الصفر.

من فريق benchr · · الأرقام محقّقة مقابل المصادر الرسمية، يونيو 2026 · سجل التغييرات

الإدخال / مليونDeepSeek · أبريل 2026
الإخراج / مليونDeepSeek
SWE-benchمحقّق
السياقأقصى سعة سياق

المواجهة المباشرة: راجع مراجعتنا التحريرية الكاملة في مراجعة DeepSeek V4-Pro، وموقع النموذج ضمن الفئة في طبقة النماذج مفتوحة المصدر الآن.

تفصيل التسعير

deepseek-v4-pro — التسعير الرسمي من المزوّد
الطبقةالسعر / مليون توكن
إدخال قياسي$0.435
إخراج قياسي$0.870
إدخال مخزَّن مؤقتًا$0.004
سعة السياق1,000,000 توكن
أقصى إخراج384,000 توكن
الرخصةMIT (قابلة للاستضافة الذاتية)

فجوة التكلفة ليست طفيفة

عند حجم إنتاج متوسط — 10 ملايين توكن إدخال و3 ملايين إخراج شهريًا — تكون الأرقام صارخة: يكلّف DeepSeek V4-Pro ‏4.35 دولار + 2.61 دولار = 6.96 دولار شهريًا. وGPT-5 عند الحجم نفسه: 12.50 دولار + 30 دولارًا = 42.50 دولار شهريًا. وClaude Opus 4.8: 50 دولارًا + 75 دولارًا = 125 دولارًا شهريًا. أي أن DeepSeek يوفّر 84% مقابل GPT-5 و94% مقابل Opus 4.8 — عند سعة السياق نفسها وبنشمارك برمجة متقارب.

وعند 100 مليون توكن إدخال + 30 مليون إخراج، يتجاوز الفرق السنوي مقابل Claude Opus 4.8 حاجز 60 ألف دولار. لفريق مموَّل، هذا راتب مهندس كامل.

تخزين مؤقت بتكلفة تقارب الصفر

الإدخال المخزَّن مؤقتًا في DeepSeek V4-Pro يكلّف 0.004 دولار لكل مليون — خصم 99% عن سعر الإدخال القياسي. قارن: Anthropic تتقاضى 0.50 دولار للمليون المخزَّن (خصم 90%)، وGoogle 0.15 دولار (خصم 90%)، وOpenAI لا تنشر سعرًا للتخزين المؤقت في GPT-5 أصلًا. لأحمال الوكلاء ذات أنظمة البرومبت الكبيرة المتكررة، يخفّض التخزين المؤقت لدى DeepSeek تكلفة الإدخال إلى ما يشبه خطأ التقريب: نظام برومبت بحجم 100 ألف توكن مخزَّن في 9 من كل 10 استدعاءات يكلّف نحو 0.04 دولار إجمالًا لا 3.92 دولار.

أين يتفوّق DeepSeek V4-Pro

أقوى ما في النموذج هو ملف الرياضيات والاستدلال طويل السياق. على بنشمارك MATH: 96.1% — الأعلى بين كل النماذج المتتبَّعة هنا. وعلى GPQA Diamond (أسئلة علمية بمستوى الدراسات العليا): 90.1%، متقدّمًا على GPT-5.5. وعلى HumanEval: 93.5%. وعلى MMLU: 92.8%. هذه ليست أرقام نموذج اقتصادي.

كذلك يلفت حد الإخراج الأقصى عند 384 ألف توكن النظر: نحو ثلاثة أضعاف سقف 128 ألفًا لدى GPT-5 وGPT-5.5 وClaude. للأحمال التي تولّد مخرجات ضخمة — قواعد شيفرة كاملة، وثائق طويلة، مجموعات بيانات اصطناعية — يصنع هذا فرقًا عمليًا.

ما لا يستطيعه

لا يملك DeepSeek V4-Pro أي قدرة رؤية أو وسائط متعددة. إدخالات الصور غير مدعومة. إن كان خط معالجتك يلامس لقطات شاشة أو ملفات PDF تحوي رسومًا أو أي بيانات بصرية، فستحتاج نموذجًا مختلفًا لتلك الخطوة — Gemini 3.5 Flash (درجة رؤية 92) أو Claude Opus 4.8 (86).

كما تغيب اتفاقيات مستوى الخدمة المؤسسية، وإقامة البيانات داخل الولايات المتحدة، وتكاملات منظومة OpenAI أو Anthropic. للصناعات المنظَّمة أو فرق البنية التحتية ذات متطلبات معالجة البيانات الصارمة، تظل هذه القيود مهمة مهما بلغت ميزة السعر.

رخصة MIT ومسار الاستضافة الذاتية

أوزان DeepSeek V4-Pro متاحة علنًا تحت رخصة MIT. الاستضافة الذاتية على بنيتك التحتية الخاصة من وحدات المعالجة الرسومية تلغي رسوم الـAPI كليًا — لا تدفع إلا مقابل الحوسبة. للفرق التي تشغّل عناقيد GPU أصلًا، تقترب التكلفة الحدّية للاستدلال على نموذج نشرته بالفعل من الصفر. العائق العملي هو ذاكرة GPU: يتطلب النموذج الكامل ذاكرة VRAM كبيرة، وتحسين الاستدلال (التكميم، التجميع الدفعي) يستهلك وقت هندسة.

تبدأ معظم الفرق بالـAPI المستضاف ولا تقيّم حالة الاستضافة الذاتية إلا حين تتجاوز التكلفة الشهرية للـAPI الكلفة السنوية المكافئة لسعة GPU المطلوبة.

ملاءمة الاستخدام

الأنسب لـ: برمجة ورياضيات بمستوى الطليعة وبتكلفة منخفضة؛ معالجة الوثائق طويلة السياق؛ أحمال الوكلاء حيث يلغي التخزين المؤقت معظم تكلفة الإدخال؛ الإنتاج المستضاف ذاتيًا بإنفاق API يقارب الصفر.

تجاوزه إذا: احتجت رؤية أو إدخال صور؛ تطلّبت بنيتك إقامة بيانات داخل الولايات المتحدة أو اتفاقيات مستوى خدمة مؤسسية؛ كان فريقك متكاملًا بعمق مع منظومة OpenAI أو Anthropic وتجاوزت تكلفة الانتقال حجم التوفير.

الصياغة الصريحة: بنشمارك DeepSeek V4-Pro حقيقية لا منتقاة بعناية. النموذج ينافس فعلًا نماذج تكلّف 3 إلى 12 ضعفًا. حجّة التكلفة قوية إلى حدّ يجعل عبء الإثبات على أسباب عدم الاستخدام لا على أسباب الاستخدام.

قائمة قرار

قبل توجيه حركة إنتاج إلى DeepSeek V4-Pro: تأكّد أن حملك نصّي وبرمجي فقط (بلا إدخالات صور)؛ تحقّق من زمن الاستجابة من منطقة بنيتك التحتية إلى نقطة DeepSeek؛ شغّل تقييمًا صغيرًا على نوع مهمتك الفعلي — بنشمارك الرياضيات والبرمجة تنتقل جيدًا، لكن أسلوب اتّباع التعليمات يختلف عن نماذج OpenAI وAnthropic.

إن كنت تنتقل من GPT-5 أو Claude: اختبر توافق نظام البرومبت، وصيغة استدعاء الدوال، وسلوك وضع JSON. واجهة الـAPI متشابهة لا متطابقة. هجرة البرومبت تستغرق ساعات لخطوط المعالجة البسيطة، وأطول لوكلاء استخدام الأدوات المعقّدة.

أسئلة متكررة

هل DeepSeek V4-Pro فعلًا بجودة الطليعة في البرمجة؟

نعم. يسجّل 80.6% على SWE-bench Verified، أي مثل Gemini 3.5 Flash وفوق GPT-5 (74.9%). وفي الرياضيات يتصدّر المجال بـ96.1% على MATH. الفجوة مع Claude Opus 4.8 (88.6%) حقيقية في أصعب مهام البرمجة، لكن لمعظم أحمال الإنتاج يبقى فرق الجودة هامشيًا وفرق التكلفة هائلًا.

هل يمكنني الاستضافة الذاتية لـDeepSeek V4-Pro؟

نعم. النموذج مرخّص برخصة MIT وأوزانه متاحة على HuggingFace. الاستضافة الذاتية تلغي تكلفة الـAPI كليًا — لا تدفع إلا مقابل زمن الاستدلال على GPU. يتطلب ذاكرة GPU كبيرة، لذلك تبدأ معظم الفرق بالـAPI المستضاف وتنتقل إلى الاستضافة الذاتية فقط حين يبرّر الحجم الشهري الاستثمار.

هل يدعم DeepSeek V4-Pro الرؤية أو إدخال الصور؟

لا. نصّي وبرمجي فقط — بلا إدخال صور أو وسائط متعددة. للرؤية، استعمل Gemini 3.5 Flash (درجة رؤية 92) أو Claude Opus 4.8 (86).

سجل التغييرات

  • — نُشرت النسخة العربية. الأرقام محقّقة مقابل الصفحة الرسمية للمزوّد.

المصادر

  • تسعير DeepSeek API — platform.deepseek.com/api-docs/pricing (محقّق يونيو 2026)
  • لوحة صدارة SWE-bench Verified — swebench.com (محقّق يونيو 2026)
  • ملف benchr models.json — محقّق يونيو 2026