السعر القياسي، والعتبة
أسعار GPT-5.5 الأساسية بسيطة: $5.00 لكل مليون توكن إدخال، و$30.00 لكل مليون توكن إخراج، و$0.50 لكل مليون للإدخال المخزّن مؤقتاً. لمعظم أحمال الدردشة وRAG والوكلاء القصيرة، هذا هو الرقم الذي تبني عليه ميزانيتك.
الفخّ هو عتبة السياق الطويل. تُدرج وثائق تسعير OpenAI أسعاراً أعلى بمجرد أن يتجاوز إدخال الطلب 272K توكن: يُحسَب الطلب عندئذٍ بنحو 2× للإدخال و1.5× للإخراج للجلسة كاملة — أي نحو $10 لكل مليون إدخال، و$45 لكل مليون إخراج، و$1 لكل مليون إدخال مخزّن. وينطبق هذا عبر standard وbatch وflex.
| فئة GPT-5.5 | إدخال / 1M | إخراج / 1M | إدخال مخزّن / 1M |
|---|---|---|---|
| القياسي (≤ 272K إدخال) | $5.00 | $30.00 | $0.50 |
| السياق الطويل (> 272K إدخال) | $10.00 | $45.00 | $1.00 |
| GPT-5.5 Pro (نموذج منفصل) | $30.00 | $180.00 | — |
الكلمة التي تحمل المعنى هنا هي الجلسة. السعر الأعلى لا يُطبَّق على التوكنز التي فوق 272K فقط — بمجرد أن يتخطى الطلب العتبة، يُحسَب كله بالسعر المرتفع. لذلك يستطيع طلب واحد ضخم أن يضاعف تكلفة نداء عادي بخلاف ذلك.
لماذا يسهل بلوغ العتبة بالخطأ
تبدو 272K توكن كثيرة حتى تبدأ العمل الوكيلي. وكيل برمجة طويل العمر يظل يُلحق مخرجات الأدوات، أو خطوة استرجاع تحشو مستندات أكثر من اللازم في السياق، أو محادثة لا تقلّم تاريخها أبداً — كل هذه قد تنجرف عبر الخط دون أن يقصد أحد طلب "سياق طويل". ولأن GPT-5.5 يعلن سعة سياق تقارب مليون توكن، يكون من المغري التعامل مع السعة كاملة كأنها متاحة بلا قيد — لكن التسعير يقول غير ذلك فوق 272K.
الحل ممل وفعّال: قيّد نمو السياق. قلّم تاريخ المحادثة، واسترجع مستندات أقل وأفضل، وراقب عدّاد توكنز الإدخال في حلقات الوكلاء الطويلة. ولرؤية أوسع لمصدر إنفاق التوكنز فعلاً، تُوحّد مقارنة أسعار نماذج الذكاء الاصطناعي هذه الأسعار عبر المزوّدين.
GPT-5.5 Pro ليس «GPT-5.5، لكن بقيمة أفضل»
المفاجأة الثانية في التسمية. GPT-5.5 Pro نموذج مستقل بسعر $30 لكل مليون إدخال و$180 لكل مليون إخراج — ستة أضعاف سعر الإدخال القياسي وستة أضعاف سعر الإخراج. وهو موجّه لأصعب مهام الاستدلال، لا للإنتاجية اليومية.
هذا الفارق في السعر كبير بما يكفي ليغيّر قرارات المعمارية. عند $180 للإخراج، إجابة مطوّلة واحدة قد تكلّف قروشاً على GPT-5.5 القياسي تصبح أغلى بفارق ملموس، ومنتج عالي الحجم مبني على Pro افتراضياً قد يتجاوز الميزانية بمرتبة كاملة. والتوصية الصريحة: معظم الفرق ينبغي ألا تبدأ على Pro. ابدأ على GPT-5.5 القياسي، وقِس أين يقصّر فعلاً، ثم وجّه تلك الطلبات المحددة وحدها إلى Pro.
خلاصات عملية
- تعامل مع 272K إدخال كحدّ ميزانية، لا حدّ قدرة فقط. تجاوزه يعيد تسعير النداء كله.
- قِس عدّادات توكنز الإدخال في حلقات الوكلاء وخطوط RAG لتلتقط الانجراف قبل أن تلتقطه الفاتورة.
- اجعل الافتراضي GPT-5.5 القياسي، واحجز Pro للاستثناءات المقيسة. نموذج بستة أضعاف ينبغي أن يكون قرار توجيه، لا افتراضاً.
- نمذِج مزيجك الحقيقي. أسعار المليون تضلّل ما لم تُرجّحها بنسبة إدخالك إلى إخراجك — مرّرها عبر الحاسبة.
- لتشكيلة OpenAI الكاملة، يغطي دليل تسعير OpenAI API كلاً من GPT-5.5 وGPT-5 وGPT-5 Mini وbatch والتخزين المؤقت معاً.