الأخبار التكنولوجية والاستعراضات والنصائح!

4 تقنيات حثيثة لحل المشكلات الصعبة ومتعددة الخطوات باستخدام LLM

ستساعدك المقالة التالية: 4 تقنيات حثيثة لحل المشكلات الصعبة ومتعددة الخطوات باستخدام LLM

عندما يتعلق الأمر بمعالجة المشكلات القائمة على التفكير ، تتمتع نماذج اللغة الكبيرة (LLMs) بسمعة سيئة. ومع ذلك ، يمكن تحسين أداءهم المنطقي بشكل كبير من خلال تطبيق طرق مباشرة لا تتطلب ضبطًا دقيقًا أو أدوات تحقق خاصة بالمهمة. دفع سلسلة التفكير (CoT) هو اسم هذه الطريقة. على وجه التحديد ، يستخدم التعلم بعدة لقطات لتعزيز قدرة LLM على التفكير الاستنتاجي. تعتمد العديد من استراتيجيات التحفيز الأكثر تقدمًا على الأساس المحفز لسلسلة الأفكار (CoT) ، وهي مفيدة في معالجة المشكلات الصعبة ومتعددة الخطوات مع LLM.

فيما يلي أربع طرق للمطالبة يمكن أن تساعد LLM على العمل من خلال المشكلات المعقدة ومتعددة الخطوات التي قدمتها الجهود الجماعية للباحثين Google وجامعة طوكيو وجامعة بكين ومايكروسوفت:

1. Zero-Shot CoT

في السيناريو الذي تفشل فيه استراتيجية التسديد الصفري التقليدية ، يُنشئ Zero-shot-CoT مسارًا منطقيًا منطقيًا بطريقة إطلاق النار ويجد الحل الصحيح. يتم تحقيق ذلك دون اللجوء إلى التعلم قليل اللقطات عن طريق إدراج “لنفكر خطوة بخطوة” في الاستعلام. على عكس الهندسة السريعة الخاصة بالمهمة السابقة ، والتي عادة ما تأخذ شكل أمثلة (لقطات قليلة) أو قوالب (لقطة صفرية) ، فإن Zero-shot-CoT مرن وغير محدد المهام ، مما يسمح له بتسهيل الإجابات خطوة بخطوة عبر مجموعة واسعة من مهام التفكير (مثل الحساب والتفكير الرمزي والاستدلال المنطقي ومهام التفكير المنطقي الأخرى) دون الحاجة إلى أي تعديل سريع.

2. من الأقل إلى الأكثر إلحاحًا

تتضمن طريقة حل مشكلة LLM التحليل العلني للمشكلة إلى أجزاء أصغر وأكثر قابلية للإدارة ، مع إدخال نتائج كل جزء في الجزء التالي.

لها مرحلتان متميزتان:

  1. التحلل: في هذه المرحلة ، يتم تقديم السؤال الذي يحتاج إلى تحليل في الموجه ، متبوعًا بسلسلة من الأمثلة المستمرة التي توضح التحلل.
  2. حل المشكلات: في هذه المرحلة ، يسبق السؤال الذي يجب الإجابة عليه مجموعة من الأمثلة الثابتة التي توضح كيفية معالجة المشكلات الفرعية ، متبوعة بقائمة من الأسئلة الفرعية التي تمت الإجابة عنها مسبقًا والحلول المتولدة ، وأخيرًا السؤال نفسه.

يمكن استخدام التوجيه من الأقل إلى الأكثر مع طرق أخرى ، مثل سلسلة التفكير والاتساق الذاتي ، ولكن هذا ليس مطلوبًا. يمكن دمج مرحلتي المطالبة من الأقل إلى الأكثر في مسار واحد لأنشطة محددة.

3. الاتساق الذاتي

تم تحسين القدرة المنطقية للنماذج اللغوية بشكل أكبر باستخدام طريقة فك تشفير فريدة تسمى الاتساق الذاتي بدلاً من تقنية فك التشفير الجشعة المستخدمة في تحفيز سلسلة الأفكار. لتحقيق الاتساق الذاتي ، يعمل الباحثون على الحدس القائل بأن هناك عدة طرق صالحة لإيجاد حل لمهام التفكير الأكثر تعقيدًا. كلما زاد الوقت والجهد في التفكير في المشكلة وتحليلها ، زادت طرق التفكير الممكنة للوصول إلى حل. ثم يتم اتخاذ القرار النهائي بتصويت الأغلبية.

4. متنوعة

بالإضافة إلى الاتساق الذاتي ، يقوم DiVeRSE بتدريب وحدة تحقق ثانية لاستنتاج / تجميع الإجابة الصحيحة من مسارات التفكير المختلفة باستخدام تقنية تسمى المجموعات الفورية (مجموعة من المطالبات التي تعالج جميعها نفس المشكلة).

DIVERSE هي استراتيجية قوية وعامة لتحسين القدرات المنطقية لنماذج اللغة الكبيرة. تتكون الأفكار الرئيسية من ثلاثة جوانب: مطالبات متنوعة ، ومدقق تصويت ، وصحة على مستوى الخطوة. باستخدام codedavinci-002 ، يتفوق DIVERSE على نموذج 540B PaLM وطرق التحفيز السابقة مجتمعة لإنتاج نتائج متطورة في معظم اختبارات التفكير.