ستساعدك المقالة التالية: تقدم ورقة AI هذه LLM + P: الإطار الأول الذي يدمج قدرات المخططين الكلاسيكيين في LLMs
يعمل الباحثون في الذكاء الاصطناعي على تطوير أنظمة يمكنها التحدث بلغة طبيعية بنفس الأناقة والقدرة على التكيف مثل الأشخاص منذ بداية هذا المجال. على الرغم من أن النماذج البسيطة جدًا ، مثل Eliza من عام 1966 ، قد تقدم ردودًا على بعض المطالبات المعقولة ، فقد كان دائمًا من السهل نسبيًا طرح أسئلة تكشف عن عيوبها مقارنة بالناس – افتقارهم إلى “الفهم” الفعلي. على الرغم من أن نماذج اللغات الكبيرة (LLMs) مثل GPT-4 و ChatGPT تجاوزت التوقعات بشكل كبير منذ بضع سنوات ، إلا أنها متشابهة. الإنترنت مليء بالأشخاص الذين يسعدون كثيرًا بالتلاعب بـ ChatGPT لإنتاج مخرجات قد يراها طفل يبلغ من العمر 5 سنوات على أنها غير حكيمة.
لا ينبغي أن يكون هذا السلوك مفاجئًا ، بالنظر إلى كيفية إنشاء LLM وتعليمها. لم يتم تصميمها مع وضع الفهم في الاعتبار. لقد تم تعليمهم لإنتاج متواليات الكلمات التي ، في ضوء السياق ، تبدو قابلة للتصديق للإنسان. وفقًا لماهوالد وآخرون ، أتقن علماء القانون فن الكفاءة اللغوية ، أو معرفة كيفية قول الأشياء ، لكنهم بحاجة إلى أن يكونوا أكثر مهارة في الكفاءة الوظيفية أو فهم ما يجب قوله. على وجه الخصوص ، يمكن أن يتم خداعهم (نسبيًا) بسهولة ، على سبيل المثال ، طلب إجابة لقضية رياضية بسيطة غير مدرجة في مجموعة تدريبهم أو طلب حل لمشكلة تخطيط فريدة تتطلب معرفة كيفية عمل العالم الخارجي .
هل يحتاجون الآن إلى العمل بجدية أكبر لدمج جميع مهام الرياضيات والتخطيط في مجموعة تدريبهم؟ هذه مهمة أحمق. لكن لماذا يجب أن يكون ضروريًا ، من ناحية أخرى؟ لديهم بالفعل مخططات وآلات حاسبة رمزية للأغراض العامة مضمونة لتحقيق نتائج دقيقة. يعد ربط LLM بمثل هذه التقنيات استراتيجية بديلة منطقية لم يكونوا أول من يبحث فيها. مع وضع هذا الغرض في الاعتبار ، يهدف البحث الموصوف في هذه الورقة إلى تزويد LLM بأول حل دقيق على الإطلاق لصعوبات التخطيط. إنهم يريدون القيام بذلك حتى مع الضبط الدقيق دون تغيير LLMs بأنفسهم.
بدلاً من ذلك ، قدم باحثون من UT Austin وجامعة ولاية نيويورك طريقة تُعرف باسم LLM + P والتي ، عند إعطائها وصفًا بلغة طبيعية لمشكلة التخطيط ، LLM:
- يخرج وصف مشكلة مناسب كمدخل لمخطط الأغراض العامة.
- يحل المشكلة باستخدام مخطط الأغراض العامة.
- يحول إنتاج المخطط مرة أخرى إلى اللغة الطبيعية.
في هذا العمل ، لا يطلبون من LLM فهم وقت تقديم مطالبة يمكن معالجتها بواسطة خط أنابيب LLM + P المقترح. سيكون التعرف على الوقت الذي يجب أن يتعامل فيه LLM + P مع مطالبة أمرًا مهمًا للبحث في المستقبل. تُظهر تحليلاتهم التجريبية الشاملة أن LLM + P يمكنها الإجابة بدقة على العديد من مشكلات التخطيط أكثر من LLMs وحدها. يمكن استخدام هذه التقنية الواسعة للرد على أي فئة من الحالات التي يوجد لها حل جيد وشامل ، مثل المسائل الحسابية (باستخدام الآلات الحاسبة) ، على الرغم من أنه تم توضيحها في هذا العمل على مشاكل التخطيط. الشفرة والنتائج متاحة للجمهور على GitHub.