الأخبار التكنولوجية والاستعراضات والنصائح!

شركة Tech Giant Microsoft تختبر ChatGPT للروبوتات

ستساعدك المقالة التالية: شركة Tech Giant Microsoft تختبر ChatGPT للروبوتات

إليك كيفية استخدام باحثي Microsoft ChatGPT للتحكم في الروبوتات والطائرات بدون طيار

مايكروسوفت مأخوذة بنماذج لغوية كبيرة مثل ChatGPT لدرجة أنها التزمت باستثمار “متعدد السنوات ومليارات الدولارات” في OpenAI. ChatGPT هو نموذج لغة كبير (LLM) تم تدريبه باستخدام مجموعة بيانات OpenAI GPT (المحولات التوليدية المدربة مسبقًا) ، والتي تحتوي على نص مقتبس من الويب ومصادر أخرى.

بفضل واجهة الدردشة ، فإن قدرة النموذج على الرد على الأسئلة بشكل شبه متماسك ، إن لم يكن دائمًا بدقة ، أكسبته مكانًا في محرك بحث Bing من Microsoft ، وضبط الألسنة التي تهز تلك الإعلانات المزينة بالإعلانات ، والمُحسّنة من محركات البحث ، والمدعومة بالدفع. قد تنتهي الهيمنة أخيرًا. تقترح Microsoft ، التي كانت مشغولة للغاية في إخماد الحرائق التي سببها مزيج الذكاء الاصطناعي في Bing ، الآن ChatGPT كوسيلة لمساعدة الناس على توجيه الروبوتات في العالم المادي. وكتبت الشركة في منشور مدونة “هدفنا من هذا البحث هو معرفة ما إذا كان بإمكان ChatGPT التفكير فيما وراء النص والعقل حول العالم المادي للمساعدة في مهام الروبوتات”.

أصدر باحثو ريدموند PromptCraft ، الذي يوصف بأنه منصة تعاونية مفتوحة المصدر لمشاركة أفضل الممارسات لصياغة استفسارات وأوامر LLM للروبوتات. اتضح أنه لا يمكنك الانتقال مباشرة إلى “فتح أبواب خليج البود ، من فضلك ، هال” إذا كنت تتفاعل مع ChatGPT كقناة تحكم صوتي لطائرة بدون طيار. يجب أن تمهد الطريق للنموذج. هناك أيضًا معلمات تنقل مهمة يجب تحديدها. ومع ذلك ، مع بعض الممارسات ، قد تتمكن من التحدث مع ChatGPT وتوجيه طائرة بدون طيار لتجد لك مشروبًا في المنطقة المحيطة. أو قد يُنشئ رمز Python الذي ، في حالة عدم حدوث أخطاء ، سيسمح للطائرة بدون طيار بالقيام بالمزايدة الخاصة بك.

بمعنى آخر ، يمكن تغذية نفس النوع من الشفرة غير الصحيحة التي أنتجها GitHub Copilot مباشرة إلى الروبوت عبر ChatGPT لمساعدته في إكمال مهمة معينة. في ورقة بحثية [PDF] بعنوان “ChatGPT for Robotics: مبادئ التصميم وقدرات النموذج” ، يصف Sai Vemprala و Rogerio Bonatti و Arthur Bucker و Ashish Kapoor من Microsoft Autonomous Systems and Robots Research Group محاولتهم لتوجيه الروبوتات عبر ChatGPT. يحدد المشروع واجهة برمجة تطبيقات عالية المستوى لـ ChatGPT ويعينها لوظائف الروبوت ذات المستوى الأدنى. بعد ذلك ، قاموا بإنشاء مطالبات نصية لـ ChatGPT والتي وصفت أهداف المهمة والوظائف المتاحة المحددة وتعيين قيود المهام.

استجاب ChatGPT بعد ذلك عن طريق إنشاء رمز خاص بالجهاز لتحقيق أي هدف محاكاة تم تحديده. الفكرة هي أن أي شخص يستخدم ChatGPT يمكنه اختبار توجيهات الروبوت حتى يعمل بشكل صحيح. استنادًا إلى قدرته على التحكم في الروبوت بالكاميرا ، يبدو أن ChatGPT قادر على “التفكير الزماني المكاني” ، مما يسمح له باستخدام أجهزة استشعار بصرية لالتقاط كرة السلة. “نرى أن ChatGPT يمكنه استخدام وظائف API المقدمة بشكل مناسب ، والسبب حول مظهر الكرة واستدعاء وظائف OpenCV ذات الصلة ، والتحكم في سرعة الروبوت باستخدام وحدة تحكم تناسبية ،” أوضحوا في الورقة.

يقال إن مثل هذا التفكير ، أو وجود نموذج منطقي للعالم ، يسهل على الروبوتات العمل بفعالية في بيئة مادية. صناعة السيارات المستقلة ليست موجودة بعد ، ويبدو أن ChatGPT ليس كذلك. في الآونة الأخيرة ، نشر Zhisheng Tang و Mayank Kejriwal من جامعة جنوب كاليفورنيا ورقة بحثية عن ArXiv تتحدى قدرة ChatGPT و DALL • E 2 على تقديم استنتاجات معقولة حول العالم. وفقًا للورقة ، “تقييم تجريبي لـ ChatGPT و DALL-E 2 بشأن اتخاذ القرار والاستدلال المكاني” ، فإن النموذجين غير متسقين.

اكتشفوا أنه “على الرغم من إظهار مستوى معين من اتخاذ القرار العقلاني ، فإن العديد من قراراتها تنتهك واحدة على الأقل من البديهيات حتى في ظل الإنشاءات المعقولة للتفضيلات والرهانات ومحفزات اتخاذ القرار” في ChatGPT. وهم يزعمون أن ChatGPT يتخذ أحيانًا القرار الصحيح لأسباب خاطئة. يقر باحثو Microsoft بأن ChatGPT به قيود ويحذرون من أنه لا ينبغي تطبيق مخرجات النموذج على روبوت دون إشراف. كتب المؤلفون في ورقتهم “نؤكد أن هذه الأدوات لا ينبغي أن تُمنح سيطرة كاملة على خط أنابيب الروبوتات ، لا سيما للتطبيقات الحرجة للسلامة”. “نظرًا لميل LLM إلى إنشاء استجابات غير صحيحة ، فمن المهم إلى حد ما ضمان جودة الحل وسلامة الكود مع الإشراف البشري قبل تنفيذه على الروبوت.”