الأخبار التكنولوجية والاستعراضات والنصائح!

تقدم ورقة الذكاء الاصطناعي هذه من ستانفورد وجوجل وكلاء التوليد: وكلاء حسابيون تفاعليون يحاكيون السلوك البشري

ستساعدك المقالة التالية: تقدم ورقة الذكاء الاصطناعي هذه من ستانفورد وجوجل وكلاء التوليد: وكلاء حسابيون تفاعليون يحاكيون السلوك البشري

لا يمكن إنكاره ، يمكن لروبوتات الذكاء الاصطناعي أن تولد لغة طبيعية ذات جودة عالية وطلاقة. لفترة طويلة ، فكر الباحثون والممارسون في بناء حضارة رمل مليئة بالوكلاء ذوي السلوكيات البشرية للتعرف على أنواع مختلفة من التفاعلات والعلاقات الشخصية والنظريات الاجتماعية والمزيد. قد تؤجج المواقف الموثوقة للسلوك البشري العديد من التطبيقات التفاعلية ، من الواقع الافتراضي إلى التدريب على المهارات الاجتماعية إلى برامج النماذج الأولية. الوكلاء الذين يستخدمون نماذج توليدية لتقليد السلوكيات الفردية والجماعية الناشئة استجابةً لهوياتهم وتجاربهم وبيئاتهم المتغيرة يقدمهم باحثون من جامعة ستانفورد وأبحاث Google.

المساهمات الرئيسية للمجموعة تتلخص فيما يلي:

  • يُطلق على الوكلاء الذين يكون سلوكهم معقولاً لأنه مشروط ديناميكيًا بتجارب العملاء المتطورة ومحيطهم عوامل توليد.
  • إطار عمل ثوري لتمكين قدرات الوكلاء التوليديين للذاكرة طويلة المدى ، والاسترجاع ، والتفكير ، والتفاعل الاجتماعي ، وتخطيط السيناريو في ظروف سريعة التغير.
  • يتم استخدام نوعين من الاختبارات (تجربة مضبوطة واختبار شامل) لتحديد قيمة الأجزاء المختلفة من البنية والعثور على مشاكل مثل استرجاع الذاكرة الخاطئ.
  • تمت مناقشة المزايا والأخطار المحتملة على المجتمع والأخلاق التي تشكلها الأنظمة التفاعلية التي توظف عوامل التوليد.

كان هدف المجموعة هو إنشاء إطار عمل افتراضي للعالم المفتوح حيث يمارس الوكلاء الأذكياء حياتهم اليومية ويتفاعلون مع بعضهم البعض بلغة طبيعية لجدولة أيامهم ، وتبادل المعلومات ، وتكوين الصداقات ، وتنسيق أنشطة المجموعة استجابةً للبيئة والتاريخ. يدل. من خلال الجمع بين نموذج لغة كبير (LLM) والآليات التي تقوم بتجميع واستخراج البيانات بناءً على مخرجات LLM ، قام الفريق بإنشاء بنية وكيل جديدة تسمح للوكلاء بالتعلم من أخطاء الماضي وإجراء استنتاجات أكثر دقة في الوقت الفعلي مع الحفاظ على فترة طويلة تماسك حرف المصطلح.

يمكن توجيه السلوكيات المعقدة من خلال التوليف العودي للوكلاء للتسجيلات في ملاحظات ذات مستوى أعلى. دفق ذاكرة الوكيل هو قاعدة بيانات تحتوي على حساب كامل لتجارب الوكيل السابقة. للتكيف مع محيطه المتحول ، يمكن للوكيل الوصول إلى البيانات ذات الصلة من دفق الذاكرة الخاص به ، ومعالجة هذه المعرفة ، وصياغة خطة عمل.

قام الباحثون بتجنيد المقيِّمين البشريين وكان 25 من وكلاءهم التوليدين المقترحين يعملون كشخصيات غير لاعبين (NPCs) في بيئة رمل سمولفيل تم تطويرها باستخدام إطار تطوير لعبة Phaser عبر الإنترنت. كانت صور العملاء المتسقة لشخصياتهم وتقليدهم المقنع للذاكرة الشبيهة بالبشر والتخطيط ورد الفعل والتفكير من السمات المميزة للتجربة. تواصلوا مع بعضهم البعض بلغة طبيعية على مدار يومين كاملين للعبة.

التطبيقات

  • من خلال الجمع بين العوامل التوليدية والنماذج متعددة الوسائط ، يمكن للمرء يومًا ما أن يمتلك روبوتات اجتماعية يمكنها التفاعل مع البشر عبر الإنترنت وغير متصل. لهذا السبب ، يمكن للمرء الآن وضع نماذج أولية للأنظمة والأفكار الاجتماعية ، واختبار تجارب تفاعلية جديدة ، وبناء نماذج أكثر واقعية للسلوك البشري.
  • تعد عملية التصميم التي تركز على الإنسان مجالًا آخر حيث يمكن استخدام النماذج المعرفية مثل GOMS ونموذج مستوى ضغط المفاتيح.
  • يتيح استخدام العوامل التوليدية كوحدات احتياطية للمستخدمين معرفة المزيد عن متطلباتهم وتفضيلاتهم ، مما يؤدي إلى تفاعلات تكنولوجية أكثر تخصيصًا وفعالية.

مع إمكانية استخدامها في لعب الأدوار ، والنماذج الأولية الاجتماعية ، والبيئات الغامرة ، والألعاب ، تساهم هذه الدراسة في تطوير محاكاة تعتمد على LLM يسكنها وكلاء يتمتعون بسلوكيات ديناميكية وتفاعلية شبيهة بالإنسان. يمكن تطوير مكونات بنية العامل التوليدي المقترحة في هذا العمل في مزيد من الدراسات. على سبيل المثال ، قد يتم تعديل وظائف الملاءمة والحداثة والأهمية التي تشكل وظيفة الاسترجاع لتحسين قدرة وحدة الاسترجاع على العثور على المواد الأكثر صلة في سياق معين. يمكن أيضًا بذل الجهود لتعزيز أداء الهندسة المعمارية وتوفير التكاليف.

يجب أن يسعى البحث المستقبلي إلى فحص سلوك العوامل المولدة على مدى فترة زمنية أطول من أجل اكتساب معرفة كاملة بقدراتهم وحدودهم ، حيث اقتصر تقييم سلوكهم في هذا العمل على جدول زمني قصير للغاية.