تفصيل التسعير
| الطبقة | السعر / مليون توكن |
|---|---|
| إدخال قياسي | $1.00 |
| إخراج قياسي | $5.00 |
| إدخال مخزّن | $0.10 |
| سعة السياق | 200,000 توكن |
| أقصى إخراج | 8,192 توكن |
ماذا تعني 145 توكن/ث فعلًا
عند 145 توكنًا في الثانية، يولّد Haiku 4.5 استجابة من 500 كلمة في نحو 3.5 ثانية. أمّا Claude Sonnet 4.6 عند نحو 85 توكن/ث فيأخذ نحو 6 ثوانٍ للاستجابة ذاتها. في التطبيقات المواجهة للمستخدم، يكون تحسّن الكمون بنسبة 40% هذا محسوسًا ويؤثّر مباشرة على التجربة. وفي الخطوط الدُّفعية يعني معالجة الحمل نفسه في 60% من الزمن — أو تشغيل حجم أكبر بنسبة 67% ضمن النافذة الزمنية نفسها.
وتتراكم ميزة السرعة في تطبيقات البثّ حيث يهمّ كمون التوكن الأول: يسلّم Haiku عادةً التوكن الأول أسرع من النماذج الأكبر، ممّا يحسّن الاستجابة المُدرَكة حتى قبل أن تصبح الإنتاجية ذات شأن.
أين تخلق نتيجة 73.3% على SWE-bench حدودها
نتيجة Haiku 4.5 البالغة 73.3% على SWE-bench أدنى بـ 6 نقاط من 79.6% لـ Sonnet 4.6. عمليًا يعني هذا أنّ Haiku يحلّ نحو 6 مشكلات أقلّ لكل 100 مقارنةً بـ Sonnet في مهام البرمجة الواقعية. للمهام البسيطة جيّدة التحديد — إصلاح دالّة واحدة، شرح كود، توليد قوالب جاهزة — تكون الفجوة غير مرئية. أمّا في إعادة الهيكلة متعدّدة الملفّات، أو التغييرات على مستوى البنية المعمارية، أو تنقيح المنطق المعقّد، فيصبح سقف Haiku الأدنى قابلًا للقياس. كما يقيّده حدّ الإخراج 8,192 توكن في مهام توليد الكود الطويل.
سيناريوهات التكلفة
عند 50 مليون إدخال + 10 ملايين إخراج شهريًا — وهو حجم إنتاجي متوسّط: يكلّف Haiku 4.5 مبلغ 50$ + 50$ = 100$ شهريًا. وClaude Sonnet 4.6 عند نفس الحجم: 150$ + 150$ = 300$ شهريًا — أي ثلاثة أضعاف الكلفة. ومع إصابة تخزين 90% على Haiku: نحو 9.50$ + 50$ = 59.50$ شهريًا. لمنتج يوجّه 10,000 استفسار مستخدم يوميًا عبر خطوة تصنيف، يكون Haiku عند 100$ شهريًا مقابل Sonnet عند 300$ شهريًا فرقَ كلفة قدره 200$ شهريًا يتناسب طرديًا مع الحجم.
ملاءمة الاستخدام
الأفضل لـ: التصنيف وكشف النية عالي الحجم؛ توجيه الاستجابة الأولى في خدمة العملاء؛ المحادثة الآنية بقيود كمون؛ الاستخلاص من المستندات المنظّمة؛ أي خطّ تكون فيه كلفة النداء والإنتاجية القيدَين الأساسيَّين وتكفي فيه جودة 73.3% على SWE-bench.
تجاوزه إن: تطلّبت مهامك توليد كود معقّد متعدّد الخطوات أو استدلالًا على مستوى البنية — فجوة الـ 6 نقاط نحو Sonnet قابلة للقياس هنا. وتجاوزه أيضًا لمهام الإخراج الطويل؛ فحدّ 8,192 توكن سيفرض اقتطاع الاستجابة.
قائمة القرار
قبل اختيار Haiku بدلًا من Sonnet: شغّل عيّنة من مهامك الفعلية على كلا النموذجين وافحص تدهور الجودة في أنماط الفشل الخاصّة بك. إن كانت مجموعة مهامك تصنيفًا أو استخلاصًا صرفًا بمخرجات منظّمة، فالأرجح أنّ Haiku يكفي. وإن تضمّنت توليد كود أو استدلالًا مفتوحًا، فقِس معدّلات النجاح على الاثنين قبل الالتزام.
افحص طول الإخراج المطلوب: إن كنت تحتاج بانتظام استجابات تتجاوز 5,000 توكن، فحدّ Haiku البالغ 8 آلاف توكن قيد صارم — ستحتاج إلى تقسيم الاستجابات أو استخدام Sonnet بدلًا منه.