تصنيف · سعة السياق · يوليو 2026

تصنيف سعة السياق لنماذج الذكاء الاصطناعي

النماذج مرتّبة حسب أقصى سعة سياق مدعومة. تصل عدة واجهات رائدة إلى مليون توكن، لكن الحد يختلف حسب النموذج: Claude Haiku 4.5 عند 200K وKimi K2.6 عند 262,144.

البيانات من models.json · محدّث 24 يوليو 2026 مبني على البيانات ومحايد

المرتبة	النموذج	المزوّد	أقصى توكنز السياق	أقصى توكنز الإخراج	الإدخال $/1M
#1	Llama 4 Scout	Meta	10,000,000	—	مجاني
#2	GPT-5.5	OpenAI	1,050,000	128,000	$5.00
#3	Gemini 3.5 Flash	Google	1,048,576	65,536	$1.50
#4	Claude Opus 4.8	Anthropic	1,000,000	128,000	$5.00
#5	Claude Opus 4.7	Anthropic	1,000,000	128,000	$5.00
#6	Claude Sonnet 4.6	Anthropic	1,000,000	64,000	$3.00
#7	Gemini 3.1 Pro	Google	1,000,000	64,000	$2.00
#8	Grok 4.3	xAI	1,000,000	—	$1.25
#9	DeepSeek V4-Pro	DeepSeek	1,000,000	384,000	$0.435
#10	DeepSeek V4-Flash	DeepSeek	1,000,000	384,000	$0.140
#11	Llama 4 Maverick	Meta	1,000,000	—	مجاني
#12	GPT-5	OpenAI	400,000	128,000	$1.25
#13	GPT-5 Mini	OpenAI	400,000	128,000	$0.250
#14	Kimi K2.6	Moonshot AI	262,144	—	$0.950
#15	Qwen3.6-27B	Alibaba	262,144	—	مجاني
#16	Mistral Large 3	Mistral	256,000	—	$0.500
#17	Mistral Medium 3.5	Mistral	256,000	—	$1.50
#18	Claude Haiku 4.5	Anthropic	200,000	64,000	$1.00
#19	Phi-4	Microsoft	16,000	—	مجاني

فئة المليون توكن شائعة وليست عامة

تصل عدة إدخالات رائدة في يوليو 2026 إلى مليون توكن على الأقل، ومنها Claude Opus 4.7 و4.8 وClaude Sonnet 4.6. لكن ذلك لا ينطبق على كل Claude أو Kimi؛ إذ تُسجّل القائمة Claude Haiku 4.5 عند 200,000 توكن وKimi K2.6 عند 262,144. اعتمد حد النموذج ونقطة النهاية المحددين، لا تعميم العائلة.

يسجل GPT-5 سعة 400 ألف توكن، أي أقل من فئة المليون في بعض النماذج الأخرى. لا يهم الفرق إذا بقيت طلباتك دون هذا الحد، لكنه يصبح قيدًا عندما تحتاج المهمة إلى مواد أكثر في طلب واحد.

الاستثناء عند 10M: Llama 4 Scout

تسجل Meta لـLlama 4 Scout سقف سياق يبلغ 10 ملايين توكن. وهو نموذج مفتوح الأوزان تحت Llama Community License، وليس مفتوح المصدر وفق OSI. وتستخدم بنيته MoE ‏109 مليارات معلمة إجمالية و17 ملياراً نشطة لكل توكن. لا يضمن السقف المنشور جودة الاسترجاع ولا اتساع الطول الكامل في أي نشر؛ تحقّق من حد المزوّد والذاكرة وبيئة الخدمة.

لا يضمن الحد المعلن أن تبقى جودة الاسترجاع عند 10 ملايين توكن مماثلة لجودتها عند 200 ألف. قد تفقد النماذج معلومات تقع في منتصف السياق الطويل، لذلك اختبر الاسترجاع من مواضع متعددة قبل الاعتماد على السعة الكاملة في الإنتاج.

حجم السياق مقابل التكلفة

السياق الأكبر يرفع الكلفة لأنك تدفع لكل توكن. طلب يضم 200 ألف توكن يكلّف خمسة أضعاف طلب يضم 40 ألفًا عند السعر نفسه. وقد يكون تقسيم المواد أو استرجاع المقاطع المطلوبة أقل كلفة من إرسال مليون توكن إلى نموذج مرتفع السعر. استخدم السعة الكبيرة عندما تثبت أنها تحسن النتيجة.

فحوص تشغيلية قبل شراء سياق أكبر

أقصى سياق هو رقم سعة، لا ضمان بأن النموذج سيستخدم كل توكن جيداً. اختبر الاسترجاع من بداية المطالبة ومنتصفها ونهايتها؛ فحالات فشل السياق الطويل تظهر غالباً في منتصف المستندات الكبيرة حيث يقبل النموذج النص لكنه لا يستخدمه بموثوقية.

قِس أيضاً زمن الاستجابة وتكلفة بناء المطالبة. استدعاء بمليون توكن قد يبسّط بنيتك، لكنه قد يكون أبطأ وأغلى من الاسترجاع مع سياق أصغر حين يكون الدليل المطلوب صفحات قليلة فقط. الخيار الصحيح هو الذي يعيد الإجابة الصحيحة بأقل سياق إجمالي، لا بأكبر سعة معلنة.

ماذا تسجّل أثناء اختبارات السياق الطويل

عند تقييم سعة سياق كبيرة، لا تكتفِ بتسجيل النجاح أو الفشل. دوّن حجم المطالبة، وموضع الدليل المطلوب، وزمن الاستجابة، وطول المخرَج، وهل استشهد النموذج بالجزء الصحيح من المصدر. نموذج ينجح فقط حين تظهر الإجابة قرب نهاية المطالبة ليس موثوقاً بما يكفي لأتمتة المستندات الكاملة.

في قواعد الشيفرة والمستندات القانونية، قد يفيد نهج هجين: يختار نظام الاسترجاع الملفات أو البنود المطلوبة، ثم يحللها النموذج ضمن سياق أصغر. استخدم السعة الكاملة عندما تحتاج إلى ربط أقسام متباعدة، لا لمجرد أن الواجهة تقبل توكنات أكثر.

للشراء، اسأل المزوّدين هل حجم السياق المعلن متاح على نقطة النهاية والمنطقة والخطة التي تنوي استخدامها بالضبط. بعض المنصات تكشف سعات أصغر عبر سُحُب الشركاء أو الأسماء البديلة القديمة، وهذا الفرق قد يكسر تصميماً مبنياً على مطالبات المستند الكامل.

سجل التغييرات

24 يوليو 2026 — حُذف تعميم المليون توكن على العائلات، وسُجل Claude Haiku 4.5 عند 200K وKimi K2.6 عند 262,144 صراحةً، وصُحح وصف Llama 4 إلى «مفتوح الأوزان، وليس مفتوح المصدر وفق OSI».

أسئلة شائعة

أي نموذج ذكاء اصطناعي يملك أكبر سعة سياق؟

تسجل Meta لـLlama 4 Scout سقفاً قدره 10 ملايين توكن. وهو نموذج مفتوح الأوزان تحت Llama Community License، وليس مفتوح المصدر وفق OSI؛ كما أن الاستضافة الذاتية لها كلفة عتاد وتشغيل. ومن بين APIs التجارية المستضافة، يقدّم كل من Claude Opus 4.8 وSonnet 4.6 سعة مليون توكن، ويقدّم GPT-5.5 نحو 1.05 مليون.

هل سعة السياق الأكبر تعني دائماً أداءً أفضل؟

لا. سعة السياق هي الحد الأقصى الذي يقبله النموذج، وليست ضمانًا لاستخدام كل جزء من النص بالدقة نفسها. قد تظهر مشكلة «الضياع في المنتصف» عند وضع الدليل بعيدًا عن البداية والنهاية. لذلك قد يتفوق نموذج بسعة أصغر إذا استرجع الدليل المطلوب بموثوقية أعلى في اختبارك.

لماذا يهمّ حجم سعة السياق؟

يحدد حجم سعة السياق كم من المعلومات يمكن للنموذج أن يأخذها في الحسبان في تمريرة واحدة. لتحليل الأكواد، تعني السعة الأكبر احتواء جزء أكبر من قاعدة الأكواد دفعة واحدة. ولمراجعة المستندات، تعني أجزاءً أقل وعبئاً أقل من التلخيص. وللوكلاء، تعني سجلات محادثة أطول دون اقتطاع. الحد العملي عادةً هو التكلفة — فالسياقات الأطول تكلف أكثر لكل استدعاء.