الأخبار التكنولوجية والاستعراضات والنصائح!

كيف يجب علينا تعظيم القدرة على التخطيط لل LLM مع تقليل تكلفة الحساب؟ تعرف على SwiftSage: وكيل مبتكر جديد للتفكير التفاعلي المعقد …

ستساعدك المقالة التالية: كيف يجب علينا تعظيم القدرة على التخطيط لل LLM مع تقليل تكلفة الحساب؟ تعرف على SwiftSage: وكيل مبتكر جديد للتفكير التفاعلي المعقد …

ينتشر الذكاء الاصطناعي بسرعة ولأسباب وجيهة. مع إدخال نماذج اللغة الكبيرة مثل GPT و BERT و LLaMA ، تستفيد كل صناعة تقريبًا ، بما في ذلك الرعاية الصحية والتمويل والتجارة الإلكترونية والوسائط ، من هذه النماذج في مهام مثل فهم اللغة الطبيعية (NLU) وتوليد اللغة الطبيعية (NLG) والإجابة على الأسئلة والبرمجة واسترجاع المعلومات وما إلى ذلك. تم تصميم ChatGPT الشهير للغاية ، والذي احتل العناوين الرئيسية منذ إصداره ، باستخدام تقنية محول GPT 3.5 و GPT 4.

تعتمد أنظمة الذكاء الاصطناعي التي تحاكي البشر اعتمادًا كبيرًا على تطوير عوامل قادرة على إظهار قدرات حل المشكلات المشابهة للبشر. الأساليب الثلاثة الأساسية لتطوير العوامل التي يمكنها معالجة مهام التفكير التفاعلي المعقدة هي – التعلم المعزز العميق (RL) ، والذي يتضمن تدريب الوكلاء من خلال عملية التجربة والخطأ ، استنساخ السلوك (BC) من خلال التسلسل إلى التسلسل (seq2seq) التعلم الذي يتضمن وكلاء التدريب عن طريق تقليد سلوك الوكلاء الخبراء وتحفيز LLMs حيث يقوم الوكلاء المولدين على أساس تحفيز LLM بإنتاج خطط وإجراءات معقولة للمهام المعقدة.

تحتوي مناهج BC المستندة إلى RL والمستندة إلى seq2seq على بعض القيود ، مثل تحليل المهام ، وعدم القدرة على الاحتفاظ بذاكرة طويلة المدى ، والتعميم على المهام غير المعروفة ، ومعالجة الاستثناءات. نظرًا لاستنتاج LLM المتكرر في كل خطوة زمنية ، فإن الأساليب السابقة تكون أيضًا مكلفة من الناحية الحسابية.

في الآونة الأخيرة ، تم اقتراح إطار عمل يسمى SWIFTSAGE لمواجهة هذه التحديات وتمكين الوكلاء من محاكاة كيفية حل البشر لمهام العالم المفتوح المعقدة. يهدف SWIFTSAGE إلى دمج نقاط القوة في استنساخ السلوك ودفع LLMs لتعزيز أداء إكمال المهام في المهام التفاعلية المعقدة. يستمد إطار العمل الإلهام من نظرية العملية المزدوجة ، التي تشير إلى أن الإدراك البشري يتضمن نظامين متميزين: النظام 1 والنظام 2. يتضمن النظام 1 تفكيرًا سريعًا وبديهيًا وتلقائيًا ، بينما يستلزم النظام 2 عمليات تفكير منهجية وتحليلية ومدروسة.

يتكون إطار عمل SWIFTSAGE من وحدتين – وحدة SWIFT ووحدة SAGE. على غرار النظام 1 ، تمثل وحدة SWIFT تفكيرًا سريعًا وبديهيًا. يتم تنفيذه كنموذج لغة تشفير وفك تشفير مضغوط تم ضبطه بدقة على مسارات عمل وكيل أوراكل. تقوم وحدة SWIFT بتشفير مكونات الذاكرة قصيرة المدى مثل الإجراءات السابقة والملاحظات والمواقع التي تمت زيارتها والحالة البيئية الحالية ، متبوعة بفك تشفير الإجراء الفردي التالي ، وبالتالي تهدف إلى محاكاة عملية صنع القرار السريعة والغريزية التي أظهرها البشر.

من ناحية أخرى ، تحاكي وحدة SAGE عمليات التفكير المشابهة للنظام 2 وتستخدم LLMs مثل GPT-4 لتخطيط الهدف الفرعي والتأريض. في مرحلة التخطيط ، يُطلب من LLM تحديد العناصر الضرورية ، والتخطيط ، وتتبع الأهداف الفرعية ، واكتشاف الأخطاء المحتملة وتصحيحها ، بينما في مرحلة التأريض ، يتم استخدام LLMs لتحويل الأهداف الفرعية للمخرجات المشتقة من مرحلة التخطيط إلى سلسلة من الإجراءات القابلة للتنفيذ .

تم دمج وحدتي SWIFT و SAGE من خلال خوارزمية إرشادية تحدد وقت تنشيط أو إلغاء تنشيط وحدة SAGE وكيفية دمج مخرجات كلتا الوحدتين باستخدام آلية المخزن المؤقت للعمل. على عكس الطرق السابقة التي تولد الإجراء التالي الفوري فقط ، تشارك SWIFTSAGE في تخطيط العمل على المدى الطويل.

لتقييم أداء SWIFTSAGE ، تم إجراء تجارب على 30 مهمة من معيار ScienceWorld. أظهرت النتائج أن SWIFTSAGE يتفوق بشكل كبير على الطرق الأخرى الموجودة ، مثل SayCan و ReAct و Reflexion. يحقق درجات أعلى ويظهر فعالية فائقة في حل المهام المعقدة في العالم الحقيقي.

في الختام ، SWIFTSAGE هو إطار واعد يجمع بين نقاط القوة في استنساخ السلوك وتحفيز LLMs. وبالتالي يمكن أن يكون مفيدًا حقًا في تعزيز تخطيط العمل وتحسين الأداء في مهام التفكير المعقدة.