الأخبار التكنولوجية والاستعراضات والنصائح!

نحن نعلم أن LLMs يمكنها استخدام الأدوات ، لكن هل تعلم أنها تستطيع أيضًا صنع أدوات جديدة؟ تلبية LLMs كصناع أدوات (LATM): A …

ستساعدك المقالة التالية: نحن نعلم أن LLMs يمكنها استخدام الأدوات ، لكن هل تعلم أنها تستطيع أيضًا صنع أدوات جديدة؟ تلبية LLMs كصناع أدوات (LATM): A …

لقد برعت النماذج اللغوية الكبيرة (LLMs) في مجموعة واسعة من مهام البرمجة اللغوية العصبية وأظهرت أدلة مشجعة على تحقيق بعض ميزات الذكاء العام الاصطناعي. كشفت الأبحاث الحديثة أيضًا عن إمكانية استكمال LLM بأدوات خارجية ، مما يزيد بشكل كبير من قدراتها في حل المشكلات وكفاءتها ، على غرار كيفية تطور الذكاء البشري. ومع ذلك ، فإن توافر الأدوات المناسبة هو المحدد الرئيسي لمدى قابلية تطبيق إجراءات استخدام الأدوات هذه. وفقًا للدروس المستفادة من هذه المعالم ، كانت قدرة الناس على إنشاء أدواتهم لحل المشكلات الجديدة نقطة تحول مهمة في التنمية البشرية.

في هذه الدراسة ، طبق باحثون من Google Deepmind وجامعة برينستون وجامعة ستانفورد هذه الفكرة التطورية في مجال LLMs ، والتي تحفزها أهمية صنع الأدوات للبشر. النظام الذي يقترحونه ، والذي يطلق عليه LLMs As Tool Makers (LATM) ، يمكّن LLMs من إنشاء أدوات قابلة لإعادة الاستخدام لتحمل مسؤوليات جديدة. تتكون استراتيجيتهم من مرحلتين أساسيتين: 1) إنشاء الأدوات: يُنشئ LLM ، الذي يُطلق عليه غالبًا منشئ الأدوات ، أدوات (يتم تنفيذها كوظائف Python) ، خاصة لوظيفة معينة. 2) تطبيق الأداة: تطبيق LLM ثانٍ ، يُعرف باسم مستخدم الأداة الذي قد يكون نفس الشخص الذي أنشأ الأداة ، يطبق الأدوات للتعامل مع الطلبات الجديدة. نظرًا للتصميم المكون من مرحلتين ، قد تقوم LATM بتعيين العمل إلى LLM الأكثر تأهيلًا في كل خطوة.

على وجه الخصوص ، قد يكون نموذجًا قويًا ولكنه كثيف الموارد (مثل GPT-4) نموذجًا للعملية المختصة لإنشاء الأدوات. من ناحية أخرى ، قد يُعزى طراز خفيف الوزن وبأسعار معقولة (مثل GPT-3.5 Turbo) إلى إجراء استخدام الأداة ، وهو أسهل بكثير. تقلل هذه الطريقة بشكل كبير من متوسط ​​تكلفة الحوسبة للتعامل مع العديد من الوظائف مع تحسين مهارات حل المشكلات لدى LLM. للحصول على قدرة معينة ، يجب تنفيذ إجراء صنع الأدوات مرة واحدة فقط. وبالتالي ، يمكن تطبيق الأدوات المنتجة على العديد من حالات المهمة.

توفر هذه الطريقة بديلاً اقتصاديًا وقابلًا للتطوير للتعامل مع المشكلات الصعبة. فكر في سيناريو يطلب فيه المستخدم من LLM ترتيب اجتماع يناسب الجميع (على سبيل المثال ، من خلال تبادل البريد الإلكتروني). غالبًا ما يصعب إكمال مشاكل التفكير الحسابي المعقدة بالنسبة للآلات خفيفة الوزن مثل GPT-3.5 Turbo. ومع ذلك ، يمكن للنماذج الأقوى ، مثل GPT-4 ، الحصول على الإجابات الصحيحة مع وجود تكاليف استدلال أعلى بكثير. باستخدام نموذج قوي ولكنه مكلف كصانع الأدوات وتسليمه إلى نموذج فعال من حيث التكلفة كمستخدم للأداة ، يتغلب LATM على هذه العقبات. بعد تشكيل الأداة ، يمكن للمستخدم استخدام الأداة للقيام بالعمل بسرعة وفعالية بعد تزوير الأداة.

يمكن أيضًا استخدام هذا النموذج لمعالجة الألعاب المعروفة مثل لعبة Sudoku ذات الـ 24 لعبة والوظائف المتكررة في عمليات أخرى مثل تحليل المقالات عبر الإنترنت وتحليلها إلى تنسيقات بيانات معينة أو إنشاء خطط توجيه تفي بالمتطلبات المتخصصة المتنوعة. يضيفون أيضًا المرسل ، وهو LLM خفيف الوزن آخر ، والذي يقرر ما إذا كان من الممكن حل مشكلة واردة باستخدام الأدوات الموجودة بالفعل أو ما إذا كان يجب تطوير أداة جديدة. يمنح هذا هندستها المعمارية درجة إضافية من الديناميكية ويسمح بإنشاء الأدوات واستخدامها في الوقت الفعلي. تُظهر تجاربهم فعالية هذه الإستراتيجية في مجموعة متنوعة من مشاكل Big-Bench الصعبة ومهام التفكير المعقدة بشكل عام.

توضح النتائج أن LATM يمكن أن تؤدي بالإضافة إلى نماذج أكثر كثافة للموارد مع كونها أكثر بأسعار معقولة. أصبحت الإمكانيات المثيرة للمجتمع النامي باستخدام الأدوات التي تم إنشاؤها بواسطة LLM ممكنة من خلال هذا النهج الفريد في LLM ، والذي يحاكي القفزة التطورية للبشر في توليد الأدوات واستخدامها.