الأخبار التكنولوجية والاستعراضات والنصائح!

تتبع المصادر المفتوحة من Google AI "MediaPipe" للهواتف الذكية

حصلت Google على مصدر مفتوح لمنظمة العفو الدولية قادر على ذلك التعرف على الأشكال اليدوية والحركات في الوقت الحقيقي في وقت سابق من هذا الأسبوع. ستساعد هذه الخطوة من جانب Google الكثير من المطورين الطموحين على تطبيق قدرات التعرف على الإيماءات لتطبيقهم.

عرضت شركة البرمجيات العملاقة هذه الميزة في وقت سابق في مؤتمر رؤية الكمبيوتر والتعرف على الأنماط (CVPR) 2019 الذي انعقد في يونيو. الكود المصدري لمنظمة العفو الدولية متاح الآن على جيثب والذي يمكنك التحقق منه من هنا. يمكنك أيضًا تنزيل arm64 APK هنا ، وإصدارًا به وضع ثلاثي الأبعاد هنا.

MediaPipe هو إطار عمل متعدد المنصات يمكن تنفيذه لبناء خطوط أنابيب لمعالجة البيانات الإدراكية بتنسيقات مختلفة (الصوت والفيديو). وهذا ممكن من خلال تطبيق تقنيات التعلم الآلي تحديد 21 نقطة رئيسية ثلاثية الأبعاد يد من إطار واحد للصورة.

"إن القدرة على إدراك شكل وحركة الأيدي يمكن أن تكون مكونًا حيويًا في تحسين تجربة المستخدم عبر مجموعة متنوعة من المجالات والمنصات التكنولوجية" ، يقرأ جوجل بلوق وظيفة بلوق.

توظف Google ثلاثة طرازات من الذكاء الاصطناعي في MediaPipe والتي يطلقون عليها BlazePalm ، نموذج المعالم اليدوي ، ومعرف الإيماءات. نموذج كاشف النخيل (BlazePalm) هو المسؤول عن تحليل الإطار وإرجاع مربع ربط اليد المنحى بينما يتم استخدام نموذج المعالم اليدوي لإرجاع نقاط مفتاح اليد ثلاثية الأبعاد من منطقة صورة مقطوعة ويستخدم أداة التعرف على الإيماءات لتصنيف تكوينات النقاط المحسوبة مسبقًا إلى مجموعة من الإيماءات.

جوجل للكشف عن النخيل

إن أروع جزء من تتبع الذكاء الاصطناعي هذا هو القدرة على تحديد الإيماءات. يقول الباحثون إن الذكاء الاصطناعي قادر على التعرف على علامات اليد الشائعة مثل "ممتاز" ، وقبضة مغلقة ، و "موافق" ، و "روك" ، و "سبايدرمان". رائع جدا ، أليس كذلك؟ ألقِ نظرة على GIF أدناه لمشاهدة الذكاء الاصطناعي في العمل.

تتبع المصادر المفتوحة من Google AI "MediaPipe" للهواتف الذكية 1

"نعتقد أن نشر هذه التكنولوجيا يمكن أن يعطي دفعة للأفكار والتطبيقات الإبداعية الجديدة من قبل أعضاء مجتمع البحث والمطورين ككل." ، كتب فالنتين بازاريفسكي وفان تشانغ ، مهندسا أبحاث في جوجل.

تتمثل الأهداف المستقبلية للباحثين في Google AI في تعزيز وظائف وكفاءة AI. قد يشمل ذلك دعمًا موسعًا للإيماءات وتتبعًا أكثر سرعة ودقة ودعمًا للإيماءات الديناميكية.