ستساعدك المقالة التالية: يقترح باحثو جامعة كارنيجي ميلون TIDEE: عامل متجسد يمكنه ترتيب الغرف التي لم يسبق رؤيتها من قبل دون أي تعليمات صريحة
تتطلب عملية الروبوت الفعالة أكثر من مجرد طاعة عمياء لأوامر محددة مسبقًا. يجب أن تستجيب الروبوتات عندما يكون هناك انحراف واضح عن القاعدة ويجب أن تكون قادرة على استنتاج سياق مهم من تعليمات غير مكتملة. تتطلب التعليمات الجزئية أو التي يتم إنشاؤها ذاتيًا نوعًا من التفكير الذي يتطلب فهمًا قويًا لكيفية تصرف الأشياء في البيئة (الأشياء ، والفيزياء ، والعوامل الأخرى ، وما إلى ذلك). هذا النوع من التفكير والعمل هو عنصر حاسم في التفكير المنطقي المتجسد ، وهو أمر ضروري للروبوتات للعمل والتفاعل بشكل طبيعي في العالم الحقيقي.
لقد تأخر مجال التفكير المنطقي المتجسد عن العوامل المجسدة التي يمكنها اتباع تعليمات محددة خطوة بخطوة لأن الأخيرة يجب أن تتعلم الملاحظة والتصرف دون تعليمات صريحة. الحس السليم المتجسد ، يمكن دراسة التفكير من خلال مهام مثل الترتيب ، حيث يجب على الوكيل التعرف على العناصر الموجودة في الأماكن الخطأ واتخاذ الإجراءات التصحيحية لإعادتها إلى إعدادات أكثر ملاءمة. يجب على الوكيل أن يتنقل ويتلاعب بذكاء أثناء البحث في المواقع المحتملة للأشياء المراد إزاحتها ، والتعرف عندما تكون الأشياء خارج مواقعها الطبيعية في المشهد الحالي وتحديد مكان إعادة وضع الكائنات بحيث تكون في المواقع المناسبة. يجتمع التفكير المنطقي لمواضع الأشياء والمهارات المرغوبة للكائنات الذكية في هذا التحدي.
TIDEE هو عامل تجسيد مقترح طوره فريق البحث يمكنه تنظيف المساحات التي لم يسبق لها مثيل من قبل دون توجيه. TIDEE هو النوع الأول لأنه يمكنه مسح مشهد للعناصر التي ليست في المكان الذي يجب أن تكون فيه ، ومعرفة مكان وضعها في المشهد لوضعها ، ثم نقلها إلى هناك بدقة.
يتحقق TIDEE من محيط المنزل ، ويعثر على أشياء في غير محلها ، ويستنتج سياقات الكائنات المحتملة بالنسبة لهم ، ويوضع مثل هذه السياقات في المشهد الحالي ، ويعيد الكائنات إلى مواقعها الصحيحة. يتم ترميز مقدمات المنطق المنطقي في شبكة البحث المرئية التي توجه استكشاف الوكيل من أجل تحديد موقع وعاء الاهتمام في المشهد الحالي بكفاءة لإعادة موضع الكائن ؛ ب) أجهزة الكشف المرئية الدلالية التي تكتشف الأشياء خارج المكان ؛ و 3) ذاكرة الرسم البياني العصبي النقابي للأشياء والعلاقات المكانية التي تقترح أوعية وأسطح دلالي معقولة لإعادة توضع الكائنات. باستخدام بيئة محاكاة AI2THOR ، وضع الباحثون TIDEE خلال خطواته من خلال جعله ينظف البيئة المحيطة الفوضوية. يكمل TIDEE المهمة مباشرة من البكسل وإدخال العمق الخام دون رؤية نفس الغرفة سابقًا ، باستخدام المقدمات فقط التي تم تعلمها من مجموعة مختلفة من منازل التدريب. وفقًا للتقييمات البشرية للتغييرات الناتجة في تخطيط الغرفة ، فإن TIDEE يؤدي أداءً أفضل من المتغيرات الجاذبة للنموذج الذي يستبعد واحدًا أو أكثر من العوامل السابقة المنطقية.
يمكن لـ TIDEE ترتيب المساحات التي لم يسبق لها مثيل من قبل دون أي توجيه أو التعرض المسبق للأماكن أو الأشياء المعنية. يقوم TIDEE بهذا من خلال النظر حول المنطقة ، وتحديد العناصر ، ووضع العلامات عليها على أنها طبيعية أو غير طبيعية. يستخدم TIDEE الاستدلال على الرسم البياني للمشهد وذاكرة الرسم البياني الخارجية لاستنتاج فئات الأوعية المحتملة عندما يكون الكائن في غير مكانه. ثم تستخدم الخريطة الدلالية المكانية للمشهد لتوجيه شبكة البحث القائمة على الصور إلى المواقع المحتملة لفئات الأوعية.
كيف تعمل؟
يقوم TIDEE بتنظيف الغرف بثلاث خطوات متميزة. يبدأ TIDEE بمسح المنطقة وتشغيل كاشف الشذوذ في كل خطوة زمنية حتى يتم العثور على جسم مشبوه. ثم ينتقل TIDEE إلى مكان وجود العنصر ويمسكه. تتضمن الخطوة الثانية TIDEE استنتاج وعاء محتمل للعنصر بناءً على الرسم البياني للمشهد وذاكرة الرسم البياني الخارجية المشتركة. إذا لم تتعرف TIDEE على الحاوية بعد ، فستستخدم شبكة بحث مرئية لتوجيه استكشافها للمنطقة واقتراح مكان اكتشاف الحاوية. يحتفظ TIDEE بالنقاط الثلاثية الأبعاد المقدرة للكائنات المحددة مسبقًا في الذاكرة ويستخدم هذه المعلومات للتنقل وتتبع الكائن.
يتم جمع السمات المرئية لكل عنصر باستخدام كاشف الكائنات المتاح تجاريًا. في الوقت نفسه ، يتم إنتاج ميزات اللغة العلائقية عن طريق تغذية تنبؤات نموذج اللغة التي تم اختبارها مسبقًا للعلاقات ثلاثية الأبعاد بين الكائنات (مثل “بجوار” ، “مدعوم من” ، “أعلاه” ، وما إلى ذلك).
يحتوي TIDEE على وحدة رسم بياني عصبي مبرمجة لتوقع أفكار وضع العناصر المحتملة بمجرد التقاط كائن. عنصر يتم وضعه ، رسم بياني للذاكرة يحتوي على اتصالات سياقية معقولة تم تعلمها من سيناريوهات التدريب ، ورسم بياني للمشهد يشفر تكوين علاقة الكائن في المشهد الحالي كلها تتفاعل لجعل وظيفة الوحدة النمطية.
تستخدم TIDEE شبكة بحث بصرية تتنبأ باحتمالية وجود كائن في كل نقطة مكانية في خريطة العوائق بالنظر إلى خريطة العائق الدلالية وفئة البحث. ثم ينظر الوكيل في تلك المناطق التي يعتقد أنه من المرجح أن تحتوي على الهدف.
TIDEE له عيبان ، وكلاهما اتجاهان واضحان للبحث في المستقبل: فهو لا يأخذ في الاعتبار الحالات المفتوحة والمغلقة للعناصر ، ولا يشمل وضعهم ثلاثي الأبعاد كجزء من عملية الفوضى وإعادة الهيكلة.
من المحتمل أن الفوضى التي تنتج عن تناثر الأشياء بلا مبالاة عبر الغرفة لا تمثل فوضى في الحياة الواقعية.
يكمل TIDEE المهمة مباشرة من البكسل وإدخال العمق الخام دون رؤية نفس الغرفة سابقًا ، باستخدام المقدمات فقط التي تم تعلمها من مجموعة مختلفة من منازل التدريب. وفقًا للتقييمات البشرية للتغييرات الناتجة في تخطيط الغرفة ، فإن TIDEE يؤدي أداءً أفضل من المتغيرات الجاذبة للنموذج الذي يستبعد واحدًا أو أكثر من العوامل السابقة المنطقية. يتفوق إصدار النموذج المبسط بشكل كبير على الحل الأفضل أداءً في معيار إعادة ترتيب الغرفة ، مما يسمح للوكيل بمراقبة الحالة الموضوعية قبل إعادة الترتيب.