RAG مقابل الضبط الدقيق، بالأرقام

أرقام التكلفة في النهجين، والثلاث حالات المحددة التي ما زال الضبط الدقيق يستحق فيها كلفته.

· عرض سجل التغييرات

RAG لكل استعلام $0.04 Sonnet 4.6 مع الاسترجاع
الاستعلام نفسه بسياق طويل $1.00 200 ألف رمز، Opus
زمن أول رمز 300ms جولة RAG + النموذج
تكلفة الضبط الدقيق $180 لمجموعة بيانات من 1K مثال

فاز RAG بحرب المعمارية في 2024. معظم الفرق، وربما فريقك، لم تعترف بذلك بعد.

خذ مساراً ينتج إدخالات سجل تغييرات منظمة من أوصاف pull request. يحقق RAG مع النموذج الأساسي مخرجات صالحة التنسيق في نحو 95% من الحالات. ضبط دقيق على 800 مثال يدفعها إلى 99.4% ويجعل الإخفاقات المتبقية قابلة للتنبؤ بما يكفي ليلتقطها مدقق بسيط. تكلفة التدريب نحو 180 دولاراً، والاستدلال بعد ذلك مجاني لكل نداء. هذا نوع الاستبدال الذي يستحق فيه الضبط الدقيق مكانه، وهو واحد من ثلاثة مواضع فقط في 2026.

في بقية الحالات، يفوز RAG: في التكلفة، والبساطة التشغيلية، وقابلية التدقيق. الصفحات التالية حجة لصالح هذا الافتراض، مع تسمية الاستثناءات الثلاثة كاملة وحساب التكلفة وراء كل منها. للصورة الأوسع للتكلفة عبر أعباء العمل، راجع جدول السعر حسب حالة الاستخدام.

كان التأطير الأولي في نقاش المصدر المفتوح يتوقع أن يدافع هذا التحليل عن الضبط الدقيق أكثر مما يفعل. الحالات التي يكررها المجتمع يتضح أنها إما حالات RAG متنكرة، أو أعباء عمل تسد فيها هندسة الأوامر الفجوة. لذلك يتوقف التصنيف أدناه عند ثلاث حالات، وهذا أبعد ما تصل إليه الأدلة بصدق.

ما الذي يفعله كل نهج

في صورته الأساسية، يسترجع RAG المعلومات ذات الصلة وقت الاستعلام ويضعها داخل الأمر. تبقى الأوزان ثابتة؛ التغيير سياقي بالكامل، ويمنح النموذج حقائق جديدة يعمل بها في كل استعلام.

يضبط الضبط الدقيق أوزان النموذج بناءً على مجموعة تدريب من أزواج إدخال ومخرجات. يتعلم النموذج بشكل دائم إنتاج مخرجات بشكل أو أسلوب أو قيود محددة. أي حقائق تعلمه إياها أثناء التدريب تُخبز داخله، لكن أي شيء يظهر بعد ذلك يبقى غير مرئي للضبط الدقيق.

غالباً ما يُقدَّم النهجان كبديلين، لكنهما لا يتنافسان إلا في حالات محددة. في معظم أعباء العمل يحلان مشكلات مختلفة، وما يتقنه أحدهما هو ما لا يستطيع الآخر لمسه.

لماذا يفوز RAG في معظم الوقت

ثلاثة أسباب، حسب الأهمية.

يتعامل RAG مع التحديثات بسلاسة. في معظم الشركات الحقيقية تتغير قاعدة المعرفة أسبوعياً، وإعادة فهرسة مخزن المتجهات على دفعة جديدة من المستندات تستغرق نحو 20 دقيقة. إعادة تدريب نموذج مضبوط دقيقاً على البيانات الجديدة نفسها تستغرق عدة ساعات وتكلف مئات الدولارات في كل دورة. من الصعب المبالغة في حجم الفجوة التشغيلية هنا.

RAG قابل للتدقيق. تستطيع فحص المقاطع المسترجعة لكل استعلام، وعندما ينتج النموذج إجابة خاطئة يمكن تتبع السبب إلى خطوة الاسترجاع أو خطوة التوليد، فتعرِف أين تصلح. النموذج المضبوط دقيقاً لا يعطيك شيئاً من ذلك. عندما يخطئ فأنت تخمن السبب، والرافعة الوحيدة لديك هي مزيد من التدريب، وقد يصلح المشكلة الأساسية وقد لا يصلحها.

حساب التكلفة يميل بقوة إلى RAG عند الأحجام الأقل من ملايين الاستعلامات يومياً. تكلفة النموذج الأساسي لكل رمز، كما تم التحقق منها مقابل صفحة أسعار Anthropic و أسعار OpenAI API حقيقية لكنها مستقرة. يضيف الاسترجاع بضع مئات من المللي ثانية وجزءاً من السنت، لذلك تبقى تكلفة الاستعلام الإجمالية دون سنت واحد في معظم أعباء العمل. يحمل الضبط الدقيق تكلفة مقدمة حقيقية لا تُستهلك إلا عند أحجام استعلامات عالية جداً. لبديل السياق الطويل، راجع مقارنة سعات السياق.

RAG مقابل الضبط الدقيق مقابل السياق الطويل، خمسة أبعاد /100

الأعلى أفضل. الأبعاد التي يكون الأقل فيها أفضل، مثل التكلفة والزمن، عُكست في الرسم.

RAG (درجة التكلفة
95
الضبط الدقيق) درجة التكلفة
80
السياق الطويل (درجة التكلفة
20
RAG) المرونة
95
الضبط الدقيق (الالتزام بالتنسيق
98
السياق الطويل) التركيب
92
25× RAG أرخص من السياق الطويل بـ25 مرة في البحث الدقيق

اعتراف صريح: لست متأكداً أن تصنيف الحالات الثلاث أدناه كامل. هذه هي الحالات الثلاث التي يستحق فيها الضبط الدقيق كلفته. ربما توجد حالة رابعة وخامسة، مثل نماذج توجيه الوكلاء التي تحتاج إلى توزيع قرارات محدد، لكن المجتمع لم يختبرها بدقة كافية للكتابة عنها بثقة.

الحالات الثلاث التي يفوز فيها الضبط الدقيق

سُمّيت كل حالة لأنها سيناريو ملموس تكون فيه الإجابة هي الضبط الدقيق، وتكون كلفة اختيار RAG بدلاً منه حقيقية.

الحالة الأولى: الالتزام الصارم بتنسيق المخرجات. يحتاج تطبيقك إلى أن ينتج النموذج مخرجات منظمة بدقة في كل مرة: مخطط JSON بلا انحراف مثلاً، أو جدول منظم بترتيب أعمدة دقيق. مع التوجيه وأمثلة few-shot، تصيب النماذج الرائدة الكبرى ذلك في نحو 95% من الوقت، وفي بعض التطبيقات تكون الـ5% المتبقية غير قابلة للاستدراك. الضبط الدقيق على 500 إلى 2,000 مثال يمكن أن يدفع الالتزام إلى 99%+ ويجعل أنماط الفشل المتبقية قابلة للتنبؤ بما يكفي لمعالجتها بمدقق بسيط.

مثال ملموس: مسار ينتج إدخالات سجل تغييرات منظمة من أوصاف pull request. نهج النموذج الأساسي كان يخطئ التنسيق بما يكفي ليتطلب تنظيفاً لاحقاً في نحو إدخال واحد من كل عشرين. نهج الضبط الدقيق يصل إلى 99.4% من المخرجات المطابقة للمخطط، وتلتقط النسبة المتبقية 0.6% بمدقق بسيط. كانت تكلفة التدريب نحو 180 دولاراً. التبسيط التشغيلي كان يستحق أكثر من ذلك بكثير.

الحالة الثانية: صوت أو أسلوب مقيد بالمجال. يحتاج تطبيقك إلى أن يكتب النموذج بصوت محدد لا تستطيع أي كمية من التوجيه فرضه بثبات: صوت علامة تجارية لنصوص التسويق، أو أعراف كتابة فريق قانوني، أو أسلوب تعليقات كود يجب أن يبقى متسقاً عبر قاعدة كود كبيرة. الضبط الدقيق على مجموعة منتقاة من أمثلة الصوت المطلوب ينتج مخرجات أقل انزياحاً وتحتاج إلى تحرير أقل من التوجيه وحده.

الكلمة المفتاحية هي بثبات. قد يحقق التوجيه الصوت الصحيح في 80% من الوقت، بينما يصل الضبط الدقيق إلى 95%+. إذا كانت الفجوة المتبقية مكلفة، مثل تحرير كل مخرج ومراجعته يدوياً، تميل الحسابات سريعاً نحو الضبط الدقيق.

الحالة الثالثة: مسارات حرجة لزمن الاستجابة. لدى تطبيقك مسار استعلام بميزانية زمن صارمة، بضع مئات من المللي ثانية من البداية إلى النهاية، وخطوة الاسترجاع في RAG تستهلك كثيراً منها. يستطيع نموذج مضبوط دقيقاً يحمل المعرفة ذات الصلة في أوزانه أن يخدم الطلب من دون جولة الاسترجاع. في تطبيقات الوقت الحقيقي مثل المساعدات الصوتية وشخصيات الألعاب، تكون هذه غالباً المعمارية الوحيدة القابلة للعمل.

المقايضة حقيقية: النموذج المضبوط دقيقاً يصبح لقطة زمنية، وأي تحديث معرفة يعني إعادة تدريب. هذا مقبول عندما تتغير المعرفة الأساسية ببطء، وكارثي عندما تتغير كل أسبوع.

خطأ الفرق هو تمديد هذه الحالات الثلاث لتغطي مشكلة تبدو فقط كواحدة منها.

الحالة التي يكرر الناس السؤال عنها

السؤال الأكثر تكراراً يأتي بصيغة قريبة من: لدي مجموعة من مستندات الشركة الداخلية. هل أضبط نموذجاً عليها أم أبني RAG؟ الإجابة غالباً RAG. ما يحسم الأمر هو حالة الاستخدام، لا مجموعة المستندات نفسها.

إذا كانت حالة الاستخدام هي تمكين الموظفين من طرح أسئلة عن المستندات، فاختر RAG. المعرفة تستمر في التغير، وتريد أن تكون التحديثات سهلة، وتريد القدرة على تدقيق مصدر كل إجابة.

إذا كانت حالة الاستخدام هي توليد مستندات بأسلوب كتابة الشركة، فاضبط النموذج دقيقاً. هنا الأسلوب هو المتطلب المركزي، بينما يمكن تزويد المعرفة الأساسية عبر السياق.

إذا كانت حالة الاستخدام تجمع الاثنين، فالإجابة هي RAG مع ضبط دقيق خفيف للأسلوب: يحمل النموذج المضبوط الصوت، وتزوّد طبقة الاسترجاع الحقائق.

تفصيل التكلفة، أسعار يناير 2026

تكلفة RAG مقابل الضبط الدقيق، أسعار يناير 2026
النهجتكلفة الإعدادتكلفة الاستعلامتكلفة التحديث
RAG على Claude Sonnet 4.6~$200 (قاعدة بيانات + وقت تطوير)$0.04 / استعلام$10 (إعادة تضمين دفعة)
RAG على GPT-5 Mini~$200$0.004 / استعلام$10
ضبط دقيق لـ GPT-4o-mini (1k مثال)~$25 + تطوير$0.001 / استعلام~$25 لكل إعادة تدريب
ضبط دقيق لـ Llama 3.1 8B (1k مثال)~$60 وقت GPU + تطوير$0 (استضافة ذاتية)~$60 لكل إعادة تدريب
ضبط دقيق لـ Claude (طبقة المؤسسات)عدة آلافمتغيرةعدة آلاف

السطر المثير للاهتمام هو ما قبل الأخير. الضبط الدقيق لنموذج صغير مفتوح الأوزان يعطيك مسار استدلال بتكلفة هامشية صفرية على عتادك. في أعباء العمل الضيقة عالية الحجم، هذه هي المعمارية المثلى تكلفةً في 2026. المقايضة هي العبء التشغيلي لتشغيل الاستدلال بنفسك، وهو ما يغطيه مقال تشغيل النماذج على جهازك الخاص.

1. استعلام المستخدم

سؤال أو تعليمات.

2. تضمين → بحث

يعثر مخزن المتجهات على أكثر K مقاطع صلة.

3. استرجاع أفضل المقاطع

عادة 3-5 مقاطع، بإجمالي 4K رمز.

4. توليد مع السياق

إجابة مثبتة على مصدر، قابلة للاستشهاد، $0.04 لكل استعلام.

هل تتغير المعرفة أسبوعياً؟

RAG إعادة التضمين في 20 دقيقة

تنسيق مخرجات صارم؟

Fine-tune ادفع الالتزام إلى 99%+

صوت/أسلوب محدد؟

Fine-tune التوجيه وحده يصل إلى 80%

زمن دون 300ms؟

Fine-tune بلا جولة استرجاع

تركيب عبر مستندات؟

سياق طويل يستحق التكلفة

هل تهم قابلية التدقيق؟

RAG افحص المقاطع المسترجعة

ليس جميلاً، لكنه يعمل.

التسلسل الافتراضي

لفريق صغير نموذجي يبني ميزة ذكاء اصطناعي متخصصة بمجال، التسلسل الموصى به هو:

  1. ابدأ بـ RAG على نموذج أساسي مثل Claude Sonnet 4.6 أو GPT-5 Mini. قِس أنماط الفشل.
  2. إذا كانت الإخفاقات تخص الحقائق أو قِدم المعلومات، حسّن الاسترجاع.
  3. إذا كانت الإخفاقات تخص الالتزام بالتنسيق، جرّب few-shot prompting أولاً. إذا لم يغلق الفجوة، اضبط النموذج دقيقاً.
  4. إذا كانت الإخفاقات تخص الأسلوب، مارس هندسة أوامر قوية أولاً. إذا فشلت، اضبط النموذج على مجموعة أسلوب منتقاة.
  5. إذا كانت الإخفاقات تخص زمن الاستجابة، قِس خطوة الاسترجاع قبل افتراض أن الضبط الدقيق هو الحل.

هذا التسلسل يشحن أسرع، ويكلف أقل، وينتج نظاماً يمكنك تصحيحه. الخطأ هو البدء بالضبط الدقيق لأنه يبدو أكثر تقدماً، بينما ما تريده هو الشيء الذي يعمل.

فجوتان تجدر الإشارة إليهما قبل الختام. ميزة التقطير في توثيق منصة OpenAI، والمقصود بها جعل ضبط نموذج صغير على مخرجات نموذج أكبر أقل تكلفة، لم تُختبر بضغط كافٍ هنا. كما أن المقارنة المضبوطة بين مناهج الضبط الدقيق، مثل LoRA مقابل الضبط الكامل مقابل prompt tuning مقابل التقطير، ما زالت معلقة. الحكمة العملية تقول إن LoRA كافٍ وأرخص بكثير، لكن هذا يستحق مقالة مستقلة.

يفوز RAG في كل مرة تقريباً. إذا كنت تبني ميزة ذكاء اصطناعي مثبتة على معرفة في 2026 ولم تبن نسخة RAG أولاً، فأنت تحسن الشيء الخطأ. عند مقياس أقل من ملايين الاستعلامات يومياً، تشير البساطة التشغيلية وقابلية التدقيق إلى اتجاه واحد، وتشير ديناميكيات تكلفة الاستعلام إلى الاتجاه نفسه.

يفوز الضبط الدقيق في ثلاث حالات، وثلاث فقط: عندما يجب أن يصل الالتزام بتنسيق المخرجات إلى موثوقية 99%+، وعندما يكون الصوت أو الأسلوب مركزياً ولا يستطيع التوجيه فرضه بثبات، وعندما تمنع ميزانية الزمن جولة الاسترجاع. وحتى حينها تكون الإجابة غالباً مزيجاً، بحيث تحمل كل تقنية الجزء الذي تتقنه من العمل.

إذا كان فريقك يضبط نموذجاً دقيقاً لأن أحدهم قال إن عليه فعل ذلك، فتوقف. دقق أنماط الفشل الفعلية للنموذج الأساسي في المهمة، واختر الأداة المناسبة لما هو معطوب. في معظم الوقت يتضح أن الجاني هو الاسترجاع أو الأمر، وأحياناً التقييم نفسه. الضبط الدقيق خيار حقيقي، لكنه شريحة أصغر بكثير من عمل الذكاء الاصطناعي في الإنتاج مما يوحي به النقاش.

الأسئلة الشائعة

RAG أم الضبط الدقيق: أيهما أستخدم؟

RAG في معظم الحالات تقريباً. ديناميكيات التكلفة، والبساطة التشغيلية، وقابلية التدقيق كلها ترجح RAG. يفوز الضبط الدقيق في ثلاث حالات محددة: الالتزام الصارم بتنسيق المخرجات، وصوت أو أسلوب مقيد بالمجال، ومتطلبات زمن استجابة دون 300 مللي ثانية.

كم يكون RAG أرخص من الضبط الدقيق؟

على مستوى الاستعلام الواحد، يكلف RAG نحو 0.04 دولار على Sonnet 4.6 مع الاسترجاع. أما نموذج صغير مضبوط دقيقاً فيعمل عملياً بتكلفة هامشية صفرية بعد تدريب يكلف نحو 60 إلى 180 دولاراً. يفوز الضبط الدقيق في تكلفة الاستعلام عند الحجم الكبير، لكن فقط في أعباء العمل المناسبة له.

متى يتفوق الضبط الدقيق على RAG؟

في ثلاث حالات. الأولى: تنسيق مخرجات صارم يجب أن يصل فيه الالتزام إلى 99% أو أكثر، بينما يصل RAG مع التوجيه وحده إلى نحو 95%. الثانية: صوت أو أسلوب محدد لا تستطيع التعليمات فرضه بشكل موثوق. الثالثة: مسارات زمن الاستجابة الحساسة حيث تكون جولة الاسترجاع بطيئة جداً.

هل يمكن الجمع بين RAG والضبط الدقيق؟

نعم، وغالباً ينبغي ذلك. اضبط النموذج للصوت والتنسيق، واستخدم RAG للحقائق. كل نهج يحمل الجزء الذي يجيده. معظم أنظمة الإنتاج التي تستخدم الضبط الدقيق بشكل صحيح تشغله إلى جانب RAG لا بدلاً منه.

كم يستغرق ضبط نموذج دقيقاً؟

عدة ساعات على مجموعة تدريب نموذجية من 1,000 مثال. التكلفة بين 25 و180 دولاراً بحسب النموذج الأساسي. إعادة التدريب على بيانات محدثة تكلف المبلغ نفسه مرة أخرى. أما إعادة فهرسة RAG على تحديث المعرفة نفسه فتستغرق 20 دقيقة وبضعة سنتات.

سجل التغييرات

  • 25 مايو 2026 — تم التحقق من الأسعار مقابل وثائق المزودين الحالية. حُدّثت أرقام التكلفة في كامل المقال لتعكس تعديلات أسعار Anthropic وطرح Gemini 3.1 Pro Preview من Google.
  • 17 أبريل 2026 — نُشر أول مرة.

المراجع

  1. OpenAI, "Platform documentation," platform.openai.com/docs, اطُّلع عليه في مايو 2026.
  2. OpenAI, "API Pricing," openai.com/api/pricing, اطُّلع عليه في مايو 2026.
  3. Anthropic، "توثيق Claude API"، docs.claude.com, اطُّلع عليه في مايو 2026.
  4. Anthropic, "Pricing," anthropic.com/pricing, اطُّلع عليه في مايو 2026.