طوال معظم العام الماضي، كان أكثر عمل أمني جرأة لدى Anthropic شيئاً تستطيع القراءة عنه لا لمسه. جلس Claude Mythos Preview — نموذج متقدم قررت الشركة ألا تبيعه — في قلب مشروع Glasswing، وهو برنامج مغلق وجّهت فيه مجموعة صغيرة من الشركاء النموذج إلى شيفرتها المصدرية بحثاً عن ثغرات. خبر هذا الشهر أن البوابة اتّسعت، وأن نسخة من القدرة صارت متاحة الآن بلا دعوة خاصة.
ما الذي تغيّر
يصف تحديث Anthropic بتاريخ 2 يونيو حركتين متمايزتين.
- كبُر Glasswing. انتقل البرنامج من نحو 50 منظمة شريكة مبدئية إلى نحو 150 إضافية، تمتد الآن عبر أكثر من 15 دولة. وسحب التوسّع عمداً مشغّلي بنى تحتية حساسة — الطاقة والمياه والرعاية الصحية والاتصالات والعتاد — قطاعات، بحسب تأطير Anthropic، "قد يصيب فيها هجوم كبير أكثر من 100 مليون شخص".
- أُطلق Claude Security. هذا هو الجزء المهم لفرق الهندسة العادية. فبدل حجب العمل خلف نموذج Mythos غير المُطلق، يستخدم Claude Security نموذج Claude Opus 4.8 المتاح للعموم لفحص قواعد الكود واقتراح الترقيعات. إنها المهمة نفسها التي يؤديها شركاء Glasswing، مُشغَّلة على نموذج يستطيع أي أحد استدعاؤه.
داخل Glasswing، ينشر الشركاء Mythos Preview لأكثر من مجرد الفحص: تدرج Anthropic بين الاستخدامات كتابة الترقيعات، والفحوص قبل الإصدار، واختبار الاختراق، وكشف التهديدات، وإعادة بناء قواعد الكود القديمة. وعبر كل الشركاء، كشف البرنامج أكثر من 10,000 ثغرة أمنية عالية أو حرجة الخطورة.
لماذا يهم
التوتر المثير هنا بين القدرة والإتاحة. النماذج من فئة Mythos جيدة في قراءة الكود إلى حد جعل Anthropic تعامل الوصول المفتوح كخطر يستحق الإدارة على مهل — فالقدرة نفسها التي تجد ثغرة يمكن أن تُستخدم لاستغلالها. وGlasswing هو الجواب القائم على الطرح المُتحكَّم به: أعطِ النموذج الأقوى للمدافعين عن الأنظمة عالية المخاطر أولاً، تحت تعاون وثيق.
وClaude Security هو النظير العملي. يقبل أن Opus 4.8 العام مدقّق كود قدير بالفعل، ويحزم ذلك في مسار عمل تستطيع الفرق تبنّيه فعلاً. إن كنت تساءلت يوماً هل النموذج المتقدم جيد بما يكفي ليكون مفيداً في مراجعة أمنية حقيقية لا في عرض تجريبي، فهذا رهان Anthropic على أن الجواب نعم — وأن الفجوة بين نموذجها المحجوب ونموذجها المُطلَق صارت صغيرة بما يكفي للتحويل إلى منتج.
تحليل، لا إعلان: قالت Anthropic أيضاً إنها تتوقع أنه "خلال 6 إلى 12 شهراً، سيكون لدى كثير من شركات الذكاء الاصطناعي الأخرى نماذج من فئة Mythos". وبقراءة ذلك بجانب إطلاق Claude Security، يبدو الأمر أقرب إلى ساعة تدق منه إلى تحذير. النافذة التي يكون فيها نموذج متقدم بدرجة أمنية عامل تمايز هي، بتقدير الشركة نفسها، محسوبة بالأشهر — فتنتقل القيمة إلى من يشغّله عملياً، لا من يملكه.
ماذا يعني للمطورين
ثلاث خلاصات عملية، مع التنبيه بأن أقوى أداة هنا ما زالت محجوبة:
- الفرز يصير أرخص، والتحقق لا. نموذج يشير إلى 10,000 مشكلة عالية الخطورة لا يفيد إلا إذا استطاع فريقك تأكيدها وإصلاحها. ينتقل عنق الزجاجة من إيجاد الأخطاء المرشّحة إلى فرزها وترقيعها — خطّط للكوادر والعملية حول النصف الثاني، لا حول الفحص.
- اقتراحات الترقيع نقطة بداية. يقترح Claude Security ترقيعات؛ وهو لا يعفيك من المراجعة. عامِل الإصلاحات المولَّدة كما تعامل أول PR لمهندس مبتدئ مقابل كود حساس أمنياً.
- مهارة قراءة الكود نفسها صارت الحد الأدنى. إن كنت تختار نموذجاً لعمل الكود عموماً، فإن قدرة التدقيق المعروضة هنا تتداخل بقوة مع التفكير اليومي حول قواعد الكود الكبيرة. مواجهة مساعدي البرمجة لدينا هي أقرب مقارنة عملية لكيفية تصرّف هذه الأدوات على مستودعات حقيقية.
التحفّظات الصادقة
أشياء قليلة لا تثبتها منشورات Anthropic، وتستحق أن تمسكها:
- رقم الـ10,000+ هو عدّ للثغرات العالية أو الحرجة الخطورة المُشار إليها عبر الشركاء، لا عدّ للثغرات المؤكَّدة والمُصلَحة. عدّ الاكتشافات الخام وعدّ المُعالَج رقمان مختلفان.
- شركاء Glasswing غير مذكورين فردياً في منشور التوسّع، وتفصيل القطاعات وصفيّ لا قائمة منشورة.
- يعمل Claude Security على Opus 4.8، لا على Mythos. القرب التسويقي بين الاثنين لا ينبغي أن يُقرأ كقدرة متكافئة.
لا شيء من ذلك يقلّل من الخطوة. هو فقط يعني أن النموذج الذهني الصحيح هو "نموذج عام قوي، مُحوَّل إلى منتج لأجل المراجعة الأمنية، بجانب نموذج محجوب أقوى يتوسّع بحذر" — وهو إطار أنفع من "الذكاء الاصطناعي صار يصلح الأمن".