الأخبار التكنولوجية والاستعراضات والنصائح!

تقنية تمكن الذكاء الاصطناعي من التفكير بعيدًا في المستقبل

ستساعدك المقالة التالية: تقنية تمكن الذكاء الاصطناعي من التفكير بعيدًا في المستقبل

طور فريق من الباحثين من معهد ماساتشوستس للتكنولوجيا ومعامل MIT-IBM Watson AI وغيرها من المؤسسات نهجًا جديدًا يمكّن وكلاء الذكاء الاصطناعي (AI) من تحقيق منظور بعيد النظر. بعبارة أخرى ، يمكن للذكاء الاصطناعي التفكير بعيدًا في المستقبل عند التفكير في كيفية تضمين سلوكياتهم سلوكيات وكلاء الذكاء الاصطناعي الآخرين عند إكمال مهمة ما.

ال بحث تم تعيينه ليتم تقديمه في مؤتمر نظم معالجة المعلومات العصبية.

منظمة العفو الدولية تنظر في الإجراءات المستقبلية للوكلاء الآخرين

يمكّن إطار التعلم الآلي الذي أنشأه الفريق وكلاء الذكاء الاصطناعي التعاوني أو التنافسي من التفكير فيما سيفعله الوكلاء الآخرون. هذا لا يتعلق فقط بالخطوات التالية ولكن مع اقتراب الوقت من اللانهاية. يقوم الوكلاء بتكييف سلوكياتهم وفقًا لذلك للتأثير على السلوكيات المستقبلية للوكلاء الآخرين ، ومساعدتهم على الوصول إلى الحلول المثلى طويلة الأجل.

وفقًا للفريق ، يمكن استخدام الإطار ، على سبيل المثال ، من قبل مجموعة من الطائرات بدون طيار ذاتية القيادة التي تعمل معًا للعثور على متنزه مفقود. يمكن أيضًا استخدامه بواسطة المركبات ذاتية القيادة لتوقع التحركات المستقبلية للمركبات الأخرى لتحسين سلامة الركاب.

Dong-Ki Kim هو طالب دراسات عليا في مختبر MIT لأنظمة المعلومات واتخاذ القرار (LIDS) والمؤلف الرئيسي لورقة البحث.

يقول كيم: “عندما يتعاون وكلاء الذكاء الاصطناعي أو يتنافسون ، فإن الأمر الأكثر أهمية هو عندما تتقارب سلوكياتهم في مرحلة ما في المستقبل”. “هناك الكثير من السلوكيات العابرة على طول الطريق والتي لا تهم كثيرًا على المدى الطويل. إن الوصول إلى هذا السلوك المتقارب هو ما نهتم به حقًا ، ولدينا الآن طريقة رياضية لتمكين ذلك “.

تسمى المشكلة التي عالجها الباحثون بالتعلم المعزز متعدد العوامل ، مع كون التعلم المعزز شكلاً من أشكال التعلم الآلي حيث يتعلم وكلاء الذكاء الاصطناعي عن طريق التجربة والخطأ.

كلما كان هناك العديد من الوكلاء المتعاونين أو المتنافسين يتعلمون في وقت واحد ، يمكن أن تصبح العملية أكثر تعقيدًا. نظرًا لأن الوكلاء يفكرون في المزيد من الخطوات المستقبلية للوكلاء الآخرين ، بالإضافة إلى سلوكهم وكيفية تأثيره على الآخرين ، فإن المشكلة تتطلب قدرًا كبيرًا من القوة الحسابية.

التفكير في الذكاء الاصطناعي حول اللانهاية

يقول كيم: “يريد الذكاء الاصطناعي حقًا التفكير في نهاية اللعبة ، لكنهم لا يعرفون متى ستنتهي اللعبة”. “إنهم بحاجة إلى التفكير في كيفية الاستمرار في تكييف سلوكهم إلى ما لا نهاية حتى يتمكنوا من الفوز في وقت بعيد في المستقبل. تقترح ورقتنا بشكل أساسي هدفًا جديدًا يمكّن الذكاء الاصطناعي من التفكير في اللانهاية “.

من المستحيل دمج اللانهاية في خوارزمية ، لذلك صمم الفريق النظام بطريقة تركز فيها الوكلاء على نقطة مستقبلية حيث يتقارب سلوكهم مع وكلاء آخرين. يشار إلى هذا باسم التوازن ، وتحدد نقطة التوازن الأداء طويل الأجل للعوامل.

من الممكن أن توجد توازنات متعددة في سيناريو متعدد العوامل ، وعندما يؤثر العامل الفعال بفعالية على السلوكيات المستقبلية للعوامل الأخرى ، يمكنهم الوصول إلى توازن مرغوب فيه من منظور الوكيل. عندما تؤثر جميع العوامل على بعضها البعض ، فإنها تتقارب مع مفهوم عام يشار إليه باسم “التوازن النشط”.

مزيد من الإطار

يُطلق على إطار التعلم الآلي للفريق FURTHER ، وهو يمكّن الوكلاء من تعلم كيفية ضبط سلوكياتهم بناءً على تفاعلاتهم مع وكلاء آخرين لتحقيق توازن نشط.

يعتمد الإطار على وحدتين للتعلم الآلي. الأول هو وحدة الاستدلال التي تمكن الوكيل من تخمين السلوكيات المستقبلية للوكلاء الآخرين وخوارزميات التعلم التي يستخدمونها بناءً على الإجراءات السابقة. ثم يتم إدخال المعلومات في وحدة التعلم المعزز ، والتي يعتمد عليها الوكيل لتكييف سلوكه والتأثير على العوامل الأخرى.

كان التحدي هو التفكير في اللانهاية. كان علينا استخدام الكثير من الأدوات الرياضية المختلفة لتمكين ذلك ، ووضع بعض الافتراضات لجعلها تعمل في الممارسة العملية ، “يقول كيم.

اختبر الفريق طريقتهم مقابل أطر التعلم المعززة متعددة الوكلاء الأخرى في سيناريوهات مختلفة حيث ظهر وكلاء الذكاء الاصطناعي الذين يستخدمون FURTHER في المقدمة.

النهج لا مركزي ، لذلك يتعلم الوكلاء الفوز بشكل مستقل. علاوة على ذلك ، فهو مصمم بشكل أفضل للقياس عند مقارنته بالطرق الأخرى التي تتطلب جهاز كمبيوتر مركزيًا للتحكم في العوامل.

وفقًا للفريق ، يمكن استخدام المزيد في مجموعة واسعة من المشكلات متعددة العوامل. يأمل كيم بشكل خاص في تطبيقاته في الاقتصاد ، حيث يمكن تطبيقه لتطوير سياسة سليمة في المواقف التي تنطوي على العديد من الكيانات المتفاعلة ذات السلوكيات والاهتمامات التي تتغير بمرور الوقت.