الأخبار التكنولوجية والاستعراضات والنصائح!

السايبورغ والكرز: الاتصال غير المحتمل – يستخدم نهج الذكاء الاصطناعي هذا التعلم المعزز لتعليم الروبوتات كيفية استخدام عيدان تناول الطعام

ستساعدك المقالة التالية: السايبورغ والكرز: الاتصال غير المحتمل – يستخدم نهج الذكاء الاصطناعي هذا التعلم المعزز لتعليم الروبوتات كيفية استخدام عيدان تناول الطعام

أصبحت الروبوتات منتشرة بشكل متزايد في حياتنا اليومية ، من المكانس الكهربائية الآلية إلى الطائرات بدون طيار التي توصل الطرود. نحن نشهد نموًا في قدرتهم على التعامل مع المهام المعقدة مع التقدم التكنولوجي. لقد بدأوا في القيام بالمهام التي كانت تقتصر في السابق على القدرات البشرية فقط.

تتمثل إحدى هذه المهام في استيعاب الأشياء في بيئات ديناميكية وغير متوقعة ، مثل انتقاء الكرز من شجرة. الفرع غير مستقر ، والرياح لا يمكن التنبؤ بها ، والكرز هو كائن صغير جدًا للإنسان الآلي. هذه مهمة صعبة للغاية بالنسبة للإنسان الآلي حيث إنه معتاد على العمل في بيئات ذات سطح صلب ، كما هو الحال في مصنع حيث تأتي أشياء معينة من خلال شريط ثابت.

هي مهمة صعبة للروبوتات بسبب أخطاء الإدراك وضوضاء المستشعر والطبيعة الديناميكية المتأصلة للمشكلة. من ناحية أخرى ، إنها مهمة موجودة في كل مكان في العديد من المجالات ، بما في ذلك التصنيع والرعاية الصحية والزراعة ، ويمكن أن يكون لأتمتتها قيمة عملية واقتصادية هائلة.

عندما نفكر في روبوت لمهمة محددة مسبقًا ، مثل تلك المستخدمة في خطوط التجميع في المصانع ، يمكن أن يكون من الممكن تصميم أجهزة معينة للمهمة المحددة. من خلال تحليل عملية التجميع والأدوات اللازمة ، يمكن للمهندسين تطوير تصميم روبوت يمكنه حل المشكلة المطروحة بكفاءة. هذا النهج فعال لأن الروبوت غير مخصص للاستخدام في المصانع الأخرى ، ولن تتغير الكائنات التي يتفاعل معها داخل بيئة المصنع. ومع ذلك ، تتغير القصة عندما نريد التوصل إلى حل شامل.

افترض أننا بحاجة إلى تطوير روبوت يمكنه استيعاب الأشياء في بيئات مختلفة دون أي قيود. نحن نعلم أن البيئة والأشياء ستكون ديناميكية. هل لا يزال من الممكن تطوير روبوت يمكنه الإمساك بالأشياء دون دعم ثابت؟ هذا هو السؤال الذي طرحه المؤلفان ، وقد توصلوا إليه CherryBot.

CherryBot هو نظام ديناميكي للتلاعب الدقيق يتعلم السلوك عن طريق التدريب المسبق في محاكاة تقريبية ثم ضبطه باستخدام RL الخالي من النماذج في العالم الحقيقي. تم تصميمه ليكون دقيقًا بدرجة كافية للتعامل مع المهمة بنجاح مع كونه قويًا ضد أخطاء الإدراك وضوضاء المستشعر. علاوة على ذلك ، يمكنه التعامل مع السيناريوهات الديناميكية مثل البيئات المتغيرة ، والأشياء المتحركة ، وما إلى ذلك أيضًا ، ويمكنه أيضًا التعميم جيدًا على الكائنات ذات الأحجام والأشكال والقوام المختلفة دون الحاجة إلى أجهزة معينة.

CherryBot يستفيد من المعلومات غير الكاملة التي يمكن الوصول إليها على معظم الروبوتات ، مثل المحاكي غير الدقيق والسياسة الأساسية القائمة على الكشف عن مجريات الأمور ، لتدريب RL ليكون نموذجًا فعالاً بشكل مدهش للتلاعب في العالم الحقيقي. تم تصميم مهام التدريب الديناميكية بشكل مناسب لتقليل الجهد البشري في عملية التدريب وتمكين سياسات أكثر قوة بشكل ملحوظ. تم تصميم مساحة العمل لتحقيق التوازن الفعال بين قابلية التعلم والتفاعل. تم تصميم النظام لاستيعاب وحدات إدراك التوصيل والتشغيل والتكيف مع الكائنات والسيناريوهات المختلفة.

CherryBot يستخدم أجهزة عامة. ذراع آلية مجمعة وعيدان تناول الطعام. هذا كل شيء. تستخدم عيدان تناول الطعام في التلاعب الدقيق. كما أن ذراع الروبوت ليست هي الذراع المثالية أيضًا. يمكن أن يوفر نتائج مستشعر غير دقيقة من وقت لآخر. على الرغم من هذه العيوب ، CherryBot يوضح رد الفعل الخارق في المهام الديناميكية عالية الدقة – باستخدام عيدان تناول الطعام لإمساك كرة زلقة تتأرجح في الهواء – بعد 30 دقيقة فقط من التفاعل في العالم الحقيقي.