الأخبار التكنولوجية والاستعراضات والنصائح!

رد الفعل: أسلوب ذكاء اصطناعي جديد يستفيد من موارد Edge و Cloud لتحسين تطبيقات تحليلات الفيديو الحية

ستساعدك المقالة التالية: رد الفعل: أسلوب ذكاء اصطناعي جديد يستفيد من موارد Edge و Cloud لتحسين تطبيقات تحليلات الفيديو الحية

ينتقل الإنترنت نحو بنية حوسبة متطورة لاستيعاب أعباء عمل DNN الحساسة لوقت الاستجابة في تطوير إنترنت الأشياء ومجالات تطبيقات الحوسبة المتنقلة. لسوء الحظ ، لا يمكن تشغيل نماذج DNN الكبيرة عالية الدقة على الحافة نظرًا لافتقارها إلى إمكانات الحوسبة ، على عكس البيئات السحابية. لذلك ، ركزت الجهود السابقة على تحويل بعض الحوسبة إلى السحابة للتحايل على هذا القيد. ومع ذلك ، فإن هذا يؤدي إلى تأخيرات أطول.

يقترح بحث جديد من Microsoft REACT ، وهي بنية فريدة تستخدم الحافة والسحابة جنبًا إلى جنب لتنفيذ العمليات الحسابية المتكررة. لتحسين جودة الاكتشاف دون المساومة على زمن الوصول ، يقومون بدمج مدخلات السحابة المستلمة بشكل غير متزامن في دفق الحساب عند الحافة. يتيح ذلك الاستفادة من دقة السحابة دون التضحية بزمن الانتقال المنخفض للحافة.

يستخدم الفريق نهجًا ذا شقين لحل مشاكل قدرة الحوسبة الضعيفة وفقدان الدقة بسبب نماذج الحافة.

  • للبدء ، يجب استدعاء تعريف كائن الحافة مرة واحدة فقط كل عدد قليل من الإطارات بسبب الارتباط الزماني المكاني بين إطارات الفيديو المتتالية. يحدث اكتشاف الحافة كل إطار خامس. يستخدمون عملية خفيفة الوزن إلى حد ما لتتبع الكائن لسد الفجوة بين مجموعتي الإطارات.
  • ثانيًا ، يتم إرسال إطارات معينة فقط إلى السحابة بشكل غير متزامن لتعزيز دقة الاستدلال. اعتمادًا على زمن انتقال الشبكة وتوافر الموارد السحابية ، لا تحصل الأجهزة المتطورة على اكتشافات سحابية لبضعة إطارات بعد ذلك.
  • بعد ذلك ، يتم دمج أحدث عمليات اكتشاف السحابة التي لم يتم الإبلاغ عنها مسبقًا مع الصورة الحالية. “للتقديم السريع” إلى الوقت الحالي ، يستخدمون الكشف السحابي الذي تم إنشاؤه في إطار قديم وإدخاله في مثيل ثانٍ من متتبع الكائن. طالما لم يكن هناك تغيير جذري في المشهد ، يمكن دمج العناصر المحددة حديثًا في الإطار الحالي.

طبق الفريق هذه الطريقة على مجموعة بيانات من مقاطع فيديو dashcam. استخدمت تجاربهم طرق رؤية الكمبيوتر المتطورة للحصول على اكتشافات محلية وعن بعد للعناصر. بالإضافة إلى ذلك ، يستخدمون الإحصاء المستخدم على نطاق واسع من مجال رؤية الكمبيوتر المعروف باسم [email protected] (متوسط ​​الدقة عند 0.5 وحدة دولية) لتقييم جودة اكتشافات الكائنات. نظروا أيضًا في مجموعتي بيانات لتحديد مدى فعالية رد الفعل:

  1. كنظام مراقبة قائم على الطائرات بدون طيار ، VisDrone
  2. نظام D2City هو نظام مساعدة في القيادة يعتمد على dashcam.

تظهر نتائج الاختبارات التي أجروها أن رد الفعل يمكن أن يوفر نتائج أفضل بنسبة تصل إلى 50٪ من الطرق الأساسية. كما يوضحون أيضًا أن نماذج الحواف والسحابة يمكن أن تكمل بعضها البعض وأن نهج اندماج سحابة الحافة المقترح يمكن أن يعزز الأداء بشكل عام.

بالإضافة إلى تتبع كائن الضوء الذي يتم إجراؤه على إطارات وسيطة ، يعمل كاشف الكائن مرة واحدة فقط لكل عدد قليل من الإطارات. من خلال تكرار الاكتشاف بين الحافة والسحابة ، يتمتع المطورون بمزيد من الحرية في اختيار عدد مرات تشغيل تطبيقاتهم على كل نظام أساسي مع الحفاظ على نفس المستوى من دقة الكشف.

يسلط الباحثون الضوء أيضًا على أن وجود العديد من الأجهزة الطرفية تستخدم نفس النموذج المستضاف على السحابة قد يؤدي إلى زيادة تكلفة استخدام موارد السحابة على عدد أكبر من السكان. على وجه الخصوص ، يمكن لوحدة معالجة الرسومات V100 دعم أكثر من 60 جهازًا متزامنًا في وقت واحد ، بافتراض أن التطبيق يمكن أن يتحمل متوسط ​​زمن انتقال يصل إلى 500 مللي ثانية.

بينما ناقش هذا العمل في الغالب تطبيقه على اكتشاف الأشياء ، يعتقد الفريق أنه يمكن تطبيقه في مواقف أخرى ، بما في ذلك تطبيقات تقدير الوضع البشري ، والمثال ، والتجزئة الدلالية ، من أجل “أفضل ما في العالمين”.