هذه هي المقارنة التي تحسم ما إذا كانت الفئة مفتوحة المصدر قد استحقت تشغيل حركتك الإنتاجية. نقطة واحدة على SWE-bench تفصل بين الاثنين — لصالح DeepSeek — بينما يفصل بين الفاتورتين فارق بمقدار رتبة كاملة. السؤال المثير ليس أي النموذجين أفضل، بل ما إذا كانت الأشياء التي ما زال Sonnet يتفوق فيها هي ما يحتاجه حِملك فعلاً.
المواصفات جنباً إلى جنب
| البُعد | DeepSeek V4-Pro | Claude Sonnet 4.6 |
|---|---|---|
| المدخلات / 1M | $0.435 | $3.00 |
| المخرجات / 1M | $0.87 | $15.00 |
| مدخلات cache-hit / 1M | $0.0036 | $0.30 |
| سعة السياق | 1,000,000 | 1,000,000 |
| أقصى مخرجات | 384,000 | 64,000 |
| SWE-bench Verified | 80.6% | 79.6% |
| GPQA Diamond | 90.1% | 89.9% |
| الترخيص | MIT (قابل للتشغيل الذاتي) | API احتكاري فقط |
الفاتورة، على خط معالجة حقيقي
خذ خط معالجة مستندات يبتلع 50M توكن مدخلات وينتج 8M توكن مخرجات شهرياً: يفرض Sonnet 4.6 $150 للمدخلات و$120 للمخرجات — $270/شهر مقابل $21.75 + $6.96 = $28.71 على V4-Pro. اضرب الاثنين في عشرة لخط معالجة جادّ، فتصبح الفجوة $2,700 مقابل $287. ومعدّل cache-hit لدى DeepSeek ($0.0036/1M) يجعل الأحمال ذات البادئة المتكررة أرخص بعد — مدخلات شبه مجانية على الموجّهات الثابتة.
ما الذي يشتريه لك Sonnet رغم ذلك
ثلاثة أشياء حقيقية، لا واحد منها على ورقة الأسعار. أولاً، انضباط حلقة الوكيل: في الاستخدام الطويل متعدد الخطوات للأدوات، يتعافى Claude من الأخطاء بسقالات أقل — وهي الفجوة التي يسمّيها مسح الفئة مفتوحة المصدر تقدّماً لا هوّة، لكنه تقدّم على كل حال. ثانياً، حكاية الامتثال: شروط API لدى Anthropic، ودعم الرؤية البصرية، وضبط الأمان، كلها تناسب عمليات المراجعة المؤسسية التي كثيراً ما لا يجتازها API المستضاف من DeepSeek. ثالثاً، صدق أقصى سياق تحت الحِمل — وإن كان DeepSeek ينشر الآن أرقامه الخاصة للسياق الطويل (83.5% على MRCR عند 1M)، وهو أكثر مما يفعله معظم المنافسين.
منفذ الهروب: التشغيل الذاتي
إذا كان الاعتراض على DeepSeek هو «بياناتنا لا يمكن أن تذهب إلى ذلك الـ API»، فرخصة MIT هي الردّ المضاد: نزّل الأوزان وشغّل V4 بنفسك. تستبدل رسوم كل توكن بتكاليف GPU وعمل التشغيل — ومقالة الاستدلال المحلي تستعرض الحساب. ولا يملك Sonnet مكافئاً. وفي البيئات الخاضعة للتنظيم، قد يحسم ذلك الصفّ الواحد من الجدول المقارنة كلها.