الأخبار التكنولوجية والاستعراضات والنصائح!

ذكاء اصطناعي للألعاب: NVIDIA تعلم شبكة عصبية لإعادة باك مان

بعد الكلمة الرئيسية الافتراضية لـ GTC الأسبوع الماضي والإعلان عن بنية Ampere ، تحتفظ NVIDIA هذا الأسبوع بالنصف الخلفي من جدول مؤتمراتها. كما هو الحال مع الحدث الحقيقي ، قامت الشركة بنشر العديد من الجلسات على كل شيء NVIDIA ، من Ampere إلى CUDA إلى سطح المكتب البعيد. ولكن ربما يكون الحديث الأكثر إثارة للاهتمام – وبالتأكيد الأكثر تسلية – قادمًا من مجموعة بحث NVIDIA.

تكلف المجموعة بتطوير التقنيات المستقبلية وإيجاد استخدامات جديدة للتقنيات الحالية ، وتعلن اليوم أنها قامت بتدريس شبكة عصبية Pac-Man.

لا ، لا أقصد كيف لعب باك مان. أعني كيف كن لعبة باك مان.

إن الكشف ، الذي يتزامن مع الذكرى السنوية الأربعين للعبة مضحكة ، يأتي من بحث NVIDIA في شبكات الخصومة التوليدية (GANs). على مستوى عالٍ جدًا ، تُعد شبكات GAN نوعًا من الشبكات العصبية حيث يتم تدريب شبكتين عصبيتين ضد بعضهما البعض – عادةً ما تتعلم واحدة كيفية القيام بالمهمة وتتعلم الأخرى كيفية تحديد أول من يقوم بهذه المهمة – والهدف النهائي هو يمكن أن يساعد التنافس بين الشبكات على جعل الشبكتين أفضل من خلال إجبارهما على التحسن للفوز. من حيث التطبيقات العملية ، تم استخدام GANs بشكل مشهور في المشاريع البحثية لإنشاء برامج يمكنها إنشاء صور واقعية للعناصر الواقعية ، وترقية الصور الموجودة ، ومهام تركيب / معالجة الصور الأخرى.

بالنسبة لـ Pac-Man ، ومع ذلك ، فإن الباحثين وراء مشروع GameGAN الذي يحمل اسمًا مناسبًا أخذوا الأمور خطوة أخرى إلى الأمام ، مع التركيز على إنشاء GAN يمكن تعليمه كيفية محاكاة / إنشاء لعبة فيديو. لا يشمل ذلك إعادة إنشاء مظهر اللعبة فحسب ، بل ربما الأهم من ذلك ، قواعد اللعبة أيضًا. في الأساس ، تهدف GameGAN إلى معرفة كيفية عمل اللعبة من خلال مشاهدتها ، وليس على عكس الإنسان.

في مشروعهم الأول ، استقر باحثو GameGAN على Pac-Man ، وهي نقطة بداية جيدة مثل أي نقطة. تحتوي لعبة 1980 على قواعد ورسومات بسيطة نسبيًا ، والأهم من ذلك بالنسبة لعملية التدريب ، يمكن لعب لعبة كاملة في فترة زمنية قصيرة. ونتيجة لذلك ، قام أكثر من 50 ألف "حلقة" من التدريب بتعليم GAN كيفية أن يصبح Pac-Man فقط عن طريق جعل الشبكة العصبية تشاهد اللعبة التي يتم لعبها.

والأكثر إثارة للإعجاب هو أن الأمر الجنوني يعمل بالفعل.

في مقطع فيديو نشرته NVIDIA ، تعرض الشركة لفترة وجيزة لعبة GameGAN المدربة من Pac-Man في العمل. في حين أن اللعبة الناتجة ليست إعادة مثالية للبيكسل لـ Pac-Man – على وجه الخصوص ، فإن دقة GameGAN المحاكية أقل – اللعبة تبدو أقل ووظائف مثل نسخة Arcade من Pac-Man. ولا يقتصر الأمر على المظهر فحسب: فإصدار GameGAN من Pac-Man يقبل إدخال اللاعب ، تمامًا مثل اللعبة الحقيقية. في الواقع ، على الرغم من أنها غير جاهزة للاستهلاك العام حتى الآن ، فقد قالت NVIDIA بالفعل أنهم يريدون إصدار نسخة قابلة للتشغيل بشكل عام هذا الصيف ، بحيث يمكن للجميع رؤيتها بشكل عملي.

ملائمًا لمشروع بحثي متعلق بالألعاب ، كان التدريب والتطوير لـ GameGAN سخيفة في بعض الأحيان. نظرًا لأن الشبكة تحتاج إلى استهلاك الآلاف على آلاف جلسات اللعب – ويفترض أن NVIDIA لا تريد أن تدفع لموظفيها للعب Pac-Man طوال اليوم – اعتمد الباحثون على روبوت لعب Pac-Man لتشغيل اللعبة تلقائيًا. ونتيجة لذلك ، تم تدريب الذكاء الاصطناعي الذي هو GameGAN بشكل أساسي في Pac-Man بواسطة AI آخر. وهذا لا يخلو من التداعيات – في عرضهم ، لاحظ الباحثون أنه نظرًا لأن بوت Pac-Man كان جيدًا جدًا في اللعبة ، فقد طور GameGAN ميلًا لتجنب قتل Pac-Man ، كما لو كان جزءًا من القواعد. وهو ، إذا لم يكن هناك شيء آخر ، أكثر راحة بكثير من معرفة أن أباطرة الذكاء الاصطناعي الذين سيصبحون قريبًا يلعبون المفضلة.

كل ما قيل ، تدريب GameGAN لـ Pac-Man استغرق إعداد GV100 رباعيًا أربعة أيام ، وخلال ذلك الوقت كان يراقب 50000 جلسة لعب. والتي ، لوضع الأشياء في منظور كمية الأجهزة المستخدمة ، فإن 4 وحدات معالجة رسومات GV100 هي 84.4 مليار ترانزستور ، أي ما يقرب من 10 مليون ضعف عدد الترانزستورات الموجودة في Z80 CPU الأصلية للعبة الأركيد. لذا ، بينما يعد تعليم GAN كيف تكون Pac-Man أمرًا مثيرًا للإعجاب بشكل لا يصدق ، ربما ، ليس طريقة فعالة بشكل خاص لتنفيذ اللعبة.

وفي الوقت نفسه ، فإن اكتشاف كيفية تعليم شبكة عصبية لتكون باك مان له بعض الأهداف العملية أيضًا. وفقًا لمجموعة البحث ، هناك تركيز كبير في الوقت الحالي على استخدام هذا المفهوم لتدريب المحاكيات بسرعة أكبر ، والتي يجب أن يتم إنشاؤها بعناية من قبل البشر من أجل التقاط جميع التفاعلات الممكنة. إذا استطاعت الشبكة العصبية بدلاً من ذلك أن تتعلم كيف يتصرف شيء ما من خلال مشاهدة ما يحدث وما هي المدخلات التي يتم إجراؤها ، فقد يؤدي ذلك إلى جعل إنشاء المحاكيات أسرع وأسهل بكثير. ومن المثير للاهتمام أن المفهوم بأكمله يؤدي إلى شيء من حلقة التغذية الراجعة الذاتية ، حيث تتمثل الفكرة في استخدام أجهزة المحاكاة هذه لتدريب الشبكات العصبية الأخرى على كيفية أداء مهمة ، مثل الهدف المفضل لـ NVIDIA وهو القيادة الذاتية للسيارات.

في النهاية ، سواء أكان ذلك يؤدي إلى مكاسب في العالم الحقيقي أم لا ، فهناك شيء بشري مسلٍ حول شبكة عصبية تتعلم لعبة من خلال المراقبة – حتى (وخاصة) إذا لم تتعلم دائمًا الدرس المطلوب.