تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $0.25 |
| إخراج قياسي | $2.00 |
| إدخال مخزَّن مؤقتًا | $0.025 |
| إدخال الدفعات (batch) | $0.125 |
| إخراج الدفعات (batch) | $1.00 |
| سعة السياق | 128,000 توكن |
أين يلمع الحجم
الرياضيات بسيطة: عند 0.25 دولار للمليون، تستطيع تمرير 100 مليون توكن إدخال شهريًا مقابل 25 دولارًا فقط. هذا يجعل Mini الخيار الطبيعي للطبقات التي تعالج كل طلب وارد قبل أن يقرّر النظام إن كان يستحق نموذجًا أكبر: كشف اللغة، تصنيف النية، استخلاص الحقول من نص حر، توجيه التذاكر. مع التخزين المؤقت عند 0.025 دولار، تهبط تكلفة البرومبت المتكرر إلى عُشرها — وهذا يهمّ كثيرًا في حلقات تعيد إرسال التعليمات نفسها آلاف المرات يوميًا.
أين يتعثّر — وبصراحة
نتيجة 48% على SWE-bench ليست رقمًا تجمّله. هي تقول إن Mini يحلّ أقل من نصف مهام البرمجة الواقعية التي يُختبر عليها. لمهمة بسيطة محدّدة جيدًا — إصلاح دالة واحدة، شرح مقطع كود — الفجوة غير محسوسة. أما إعادة الهيكلة متعددة الملفات أو تتبّع منطق معقّد، فهنا يفشل بثبات. القاعدة العملية: استخدمه حيث الخطأ رخيص وقابل للكشف، لا حيث يكلّف الخطأ مراجعة بشرية مطوّلة.
سيناريو التكلفة
منتج يمرّر 10,000 استعلام مستخدم يوميًا عبر خطوة تصنيف: عند ~500 توكن للاستعلام، هذا 150 مليون توكن إدخال شهريًا = نحو 37.5 دولار على Mini. النموذج نفسه على GPT-5 يكلّف ~187 دولارًا. الفرق 150 دولارًا شهريًا يتناسب طرديًا مع الحجم — وهذا تحديدًا سبب وضع Mini كطبقة أولى ثم التصعيد عند الحاجة فقط.