
Image by Freepik
تمكن SEAL الخاص بـ MIT الذكاء الصناعي من التعلم الذاتي والتكيف المستمر
قام الباحثون في معهد ماساتشوستس للتكنولوجيا في مختبر الذكاء الصناعي “Improbable AI Lab” بتطوير إطار عمل مبتكر يُطلق عليه الاسم SEAL (وهو اختصار لـ Self-Adapting LLMs). يتيح SEAL لأنظمة الذكاء الصناعي تعلم مهارات جديدة بعد التدريب الأولي من خلال التعليم الذاتي.
مستعجل؟ هنا الحقائق السريعة:
- طورت MIT SEAL، وهو إطار عمل يسمح للذكاء الصناعي بتعلم مهارات جديدة بنفسه.
- يعيد SEAL كتابة تدريبه الخاص باستخدام ملخصات واختبارات وملاحظات تم إنشاؤها بنفسه.
- حققت نسبة استرجاع أفضل بنسبة 40% ونجاح بنسبة 72.5% في المهام المنطقية.
يتجاوز النظام الجديد النماذج اللغوية الكبيرة الموجودة حاليا، بما في ذلك ChatGPT، التي توضح الباحثات عادة أنها تظل ثابتة بمجرد التدريب عليها وتتطلب إعادة تدريب واسعة لتعلم معلومات جديدة.
تكمن القفزة الرئيسية لـ SEAL في قدرتها على السماح للذكاء الصناعي بإنتاج المواد التدريبية الخاصة به ثم استخدام هذه المواد لتعديل نفسها. بالفعل، عندما يتم تقديم بيانات جديدة – مثل مقالة أخبار أو مهام على سبيل المثال – يقوم النظام بإنشاء تفسيرات مبسطة، أو حقائق ذات صلة، أو أسئلة تدريبية.
يوضح الباحثون هنا أن هذه العملية تحاكي طرق التعلم البشرية، حيث يتعدد الناس عادة بكتابة الملاحظات والبطاقات التعليمية لتحسين فهمهم واستيعابهم للمعلومات الجديدة.
خلال مرحلة “الحلقة الداخلية”، يقوم SEAL بتنفيذ تحديث صغير يعرف بـ “التعديل الذاتي”. يجري النظام تقييمًا لـ “الحلقة الخارجية” للتحقق من تحسن أدائه بعد التحديث. عندما يتعرف الذكاء الصناعي على تغيير إيجابي، يتذكر التعديل؛ وإلا، يقوم بتجربة نهج جديدة.
يقول الباحثون أن هذه العملية التكرارية تتيح للذكاء الصناعي تحسين معرفته باستمرار والتكيف مع التحديات الجديدة دون الحاجة إلى إعادة التدريب الكامل.
تلاحظ الباحثات أن الأسلوب الذي يستخدمه SEAL يتميز عن جميع الأساليب التقليدية للتعلم المعزز (RL). تتعلم الوكالات في بيئات RL القياسية من خلال التجربة والخطأ لتعظيم مكافآتها عندما يتفاعلن مع محيطاتهن.
يستخدم SEAL RL كأداة لتدريب نظام الذكاء الصناعي الخاص به لإنشاء وتنفيذ موارده الخاصة للتعلم، مما يجعل نموذج اللغة مدربًا وطالبًا في الوقت نفسه. ينتج النظام “تعديلات ذاتية”، التي تتضمن تعليمات شخصية جنبًا إلى جنب مع البيانات الصناعية لعملية تحسينه. يتيح هذا النهج تحديثات ذاتية مستمرة لا يمكن للأساليب التقليدية لـ RL، التي لا تقوم بتعديل المعاملات المباشرة للنموذج، تحقيقها.
قام الباحثون في MIT بتجربة SEAL على جبهتين. أولاً، في تعلم الحقائق الجديدة، قام SEAL بتحويل النص الخام إلى ضمنيات وتنسيقات الأسئلة والأجوبة، مما أسفر عن تحسن في الدقة بنسبة 47% تجاوز حتى مواد تدريب GPT-4.1. ثانياً، في مهام التفكير التجريدي، حقق SEAL نسبة نجاح بلغت 72.5%، متفوقاً على النماذج التي لا تستخدم التعلم التعزيزي أو التدريب القياسي.
يجادل الباحثون أن التطبيقات المحتملة واسعة النطاق. قد يتيح SEAL تطبيقات متنوعة تتراوح من المعلمين الذكاء الاصطناعي المخصصة، إلى الشركاء البحثيين الذين يتطورون بشكل ذاتي، والوكلاء المستقلين الذين يتحسنون من خلال الخبرة.
تمتلك التكنولوجيا القدرة على تحويل أنظمة الذكاء الاصطناعي في المؤسسات من خلال السماح لها بتطوير قدرات التفكير الداخلي، والتي تحل محل الحاجة إلى عمليات التدريب المكلفة للتعامل مع التغيرات السريعة في البيانات ومتطلبات المستخدمين.
ومع ذلك، لا تزال هناك تحديات، على سبيل المثال، يمكن أن تعاني SEAL من ما يسميه الباحثون بـ “النسيان الكارثي”، حيث تكتب التعلمات الجديدة فوق المعرفة السابقة، وتتطلب عملية التحرير الذاتي موارد حوسبة كبيرة.
للتخفيف من هذه القضايا، يقترح الفريق أنظمة مختلطة تجمع بين SEAL مع أدوات خارجية للذاكرة المؤقتة، محتفظة بتحديثات SEAL للمعرفة الأساسية والطويلة الأجل.
بالرغم من هذه العقبات، يعتقد الباحثون في MIT أن هذه التكنولوجيا ستساعد الأجهزة على تحقيق مرونة مشابهة للإنسان، وقدرات التعلم مدى الحياة.