6 طرق يمكنك من خلالها استخدام التعلم العميق لتحسين سهولة استخدام الأجهزة المحمولة

نُشر هذا المقال في الأصل على موقع M Liquido.com في 23 يناير 2020 ، وقد كتبه Radosław Holewa.

مع تزايد الطلب العالمي على تجارب الهاتف المحمول المحسنة والأكثر تخصيصًا ، والذكاء الاصطناعي الواسع النطاق وتكييف التعلم العميق في صناعة تطوير تطبيقات الهاتف المحمول أمر لا مفر منه. نسيان مشاكل الكمون المحبطة التي تنشأ عن الاستشعار المحمول والحوسبة السحابية. يقترب وقت الاستجابة من الصفر تقريبًا ، مع سرعات معالجة البيانات في الوقت الفعلي لتحقيق أفضل النتائج.

Appleتساعد شرائح الهواتف الذكية Bionic المتطورة مع وحدات المعالجة العصبية المدمجة الشبكات العصبية على العمل مباشرة على الجهاز بسرعات لا تصدق. باستخدام Appleيمكن لـ Core ML ومنصات ML Kit من Google ومكتبات التعلم العميق مثل TensorFlow Lite و Keras ، يمكن لمطوري الجوال إنشاء تطبيقات بوقت استجابة أقل ، وأخطاء أقل ، ومعالجة أسرع للبيانات.

تتمثل الميزة الرئيسية للتعلم الآلي على الجهاز في أنه يوفر للمستخدمين تجربة مستخدم سلسة ودقيقة. نظرًا لعدم وجود مشكلة في إرسال البيانات إلى الخوادم الخارجية للمعالجة ، فإنك تحصل على حماية محسنة للبيانات وأمان المستخدم وخصوصيته. أيضًا ، مع الشبكات العصبية على أجهزة الجوال ، لا تحتاج إلى الاتصال بالإنترنت للوصول إلى كل ميزة من تطبيقاتك. بالطبع ، ستظل بحاجة إلى الإنترنت لمعظم الميزات القياسية.

لقد أدى استخدام إمكانات الحوسبة للأجهزة المحمولة لتنفيذ خوارزميات التعلم العميق إلى تحسين إمكانية استخدام الأجهزة المحمولة. إليك الطريقة:

1. التعرف على الكلام على الجهاز

يتضمن التعرف على الكلام تحويل أو تحويل تسلسلات الإدخال إلى تسلسلات إخراج باستخدام الشبكات العصبية المتكررة (RNN) والشبكات العصبية التلافيفية (CNN) والشبكات العصبية العميقة (DNN) وغيرها من البنى. واجه المطورون مشكلة في الكمون – مما يخلق تأخيرات بين طلبك واستجابة المساعد الآلي – ولكن يمكننا الآن التغلب عليها باستخدام تقنية محول الشبكة العصبية المتكررة (RNN-T) المدمجة في الأجهزة المحمولة.

RNN-Ts هي نماذج من تسلسل إلى تسلسل. وبدلاً من اتباع الطريقة المعتادة لمعالجة تسلسل إدخال كامل قبل إنتاج مخرجات ، إلا أنها تحافظ على استمرارية ثابتة في معالجة المدخلات وتدفق الإخراج. هذا يسهل التعرف على الكلام ومعالجته في الوقت الحقيقي. ترى هذا مع Google Assistant، والتي يمكنها معالجة الأوامر الصوتية المتتالية دون تعثر ودون مطالبتك باستدعاء "Hey، Google" بعد كل طلب.

إنها تجعل محادثة أكثر طبيعية ، ثنائية الاتجاه ، وسيقوم المساعد باتباع التعليمات الخاصة بك إلى T. هل تريد تعيين موضوع بريد إلكتروني والعثور على صورة في أحد مجلداتك وإرشادك إلى مكان أختك؟ تم التنفيذ.

من خلال المضي قدمًا في هاتف Pixel 4 الجديد من Google ، يمكن لميزة "التسمية التوضيحية المباشرة" توفير ترجمات للملاحظات الصوتية وملفات البودكاست ومقاطع الفيديو في الوقت الفعلي – ولأن المعالجة على الجهاز – في وضع الطائرة أيضًا. لذا ، على سبيل المثال ، إذا ظهر مقطع فيديو في Twitter خلاصة ، يمكنك معرفة ما يدور حوله من التسميات التوضيحية ، دون الحاجة إلى إعادة كتم الصوت. لا تعمل ميزة "التسمية التوضيحية المباشرة" مع الموسيقى أو مكالمات الهاتف والفيديو حتى الآن.

2. زيادة الكفاءة مع التعرف على الإيماءات

باستخدام نماذج خطوط أنابيب التعلم الآلي على الجهاز ، يمكنك تدريب جهازك المحمول على اكتشاف إيماءات اليد والجسم وتتبعها والتعرف عليها. تقوم كاميرا جهازك بتسجيل وتخزين إيماءاتك وحركاتك كبيانات صورة ثلاثية الأبعاد. بعد ذلك ، تستخدم خوارزميات التعلم العميق للشبكات العصبية مكتبة الإيماءات هذه لتحديد إيماءات ثابتة وديناميكية محددة وفك تشفيرها. ثم يقومون بمطابقتهم في الوقت الحقيقي لنيتك وتنفيذ الأوامر التي تريدها.

جوجل بيكسل 4 smartphones تأتي مع شريحة Soli التي تسهل التفاعل المعقد وغير اللفظي مع هاتفك. يعمل مستشعر الرادار المصغر هذا الموجود أعلى الهاتف على تشغيل تقنية Motion Sense التي يمكنها اكتشاف وجودك وإيماءات اليد والجسم لتمكين تفاعلات هاتفك. مع موجة من يدك ، حتى دون لمس الهاتف ، يمكنك إخباره أن يؤجل ، أو يصمت إنذارًا ، أو ينتقل إلى الأغنية التالية في قائمة التشغيل الخاصة بك.

3. القدرات الغامرة للواقع المعزز

باستخدام ARCore و Google Appleمن منصات ARKit ، يمكن للمطورين إنشاء تطبيقات الواقع المعزز التي يمكن أن تجمع بين الأشياء والبيئات الرقمية مع إعدادات واقعية. للقدرات الغامرة للواقع المعزز القائم على الهاتف تأثير كبير على البيع بالتجزئة والترفيه والسفر وغيرها من الصناعات. تسمح العلامات التجارية مثل Lacoste و Sephora الآن لعملائها بتجربة أو معاينة المنتجات باستخدام تطبيقات الواقع المعزز ، ويفضل عدد متزايد من المتسوقين فحص المنتجات على هواتفهم قبل اتخاذ قرار شرائها.

تلقت ألعاب الواقع المعزز التفاعلية مثل Pokemon و Ingress و Ghostbusters World صحافة واسعة ومتابعة مخصصة. إذا كنت تريد العثور على طريقك في جميع أنحاء المدينة ، فستوفر لك ميزة العرض المباشر لخرائط Google التنقل في الوقت الفعلي.

كاميرا Leica الرباعية على Huawei P30 Pro.

4. صور عالية الجودة

تعد جودة الصورة العالية معيارًا مهمًا للمشترين عند الاختيار smartphones، والتي يمكنهم الحصول عليها مع العديد من أحدث الموديلات. وتأتي هذه مجهزة بمكونات الأجهزة – وحدات المعالجة المركزية (CPU) ، ومعالجات إشارات الصور ، وخوارزميات صور التعلم العميق ، ووحدات المعالجة العصبية – التي قفزت smartphones في عالم مختلف تمامًا عن الكاميرات التقليدية عندما يتعلق الأمر بالتقاط الصور. مع هذه ، smartphones يمكن أن تظهر مزيدًا من الوعي على مستوى تصنيف البكسل لما يرونه لتصوير صور عالية الدقة.

هواتف جوجل بكسل و Apple تستخدم أجهزة iPhone العديد من الكاميرات وخوارزميات التعلم الآلي المعقدة للتعرف على الأشخاص والكائنات ، وإنشاء خرائط عمق ، والانضمام بسلاسة إلى التعرض الطويل ، وحساب توازن الألوان الدقيق.

من خلال تدريب الشبكات العصبية على مجموعة بيانات من الصور ، تتعلم الخوارزميات كيفية الاستجابة لمتطلبات الصورة الفردية وتنقيح الصور في الوقت الفعلي. يتيح نظام التصحيح التلقائي الذي طوره باحثون من معهد ماساتشوستس للتكنولوجيا وجوجل للمصورين الفوتوغرافيين تطبيق أنماط مختلفة على الصورة قبل التقاط الصورة.

بعد أن تقوم شبكة تلافيفية بمعالجة الصور بدقة منخفضة ، فإن طريقة التعيين المعروفة بتحويل الألوان المنتسبة تعدل ألوان بكسل الصورة. تقوم الشبكة بتخزين هذه الصيغ التحويلية في شبكة ثلاثية الأبعاد تمكن بعد ذلك من إخراج صورة عالية الدقة. كل هذا يحدث في غضون مللي ثانية.

تتفوق الهواتف الذكية الآن أيضًا على كاميرات DSLR في التصوير في الإضاءة المنخفضة والليل. من خلال دمج الشبكات وأجهزة الاستشعار العصبية العميقة ، يمكن لكاميرات الهواتف الذكية التقاط صور أكثر وضوحًا بألوان أكثر مما يمكن للعين البشرية رؤيته.

تستخدم Huawei ، التي قدمت لقطات قابلة للعمل في الإضاءة المنخفضة مع P20 Pro ، فلاتر RYYB وأجهزة استشعار كبيرة ومعالجة صور AI في سلسلة Mate 30 لتقديم تصوير عالي الجودة ومنخفض الإضاءة بالإضافة إلى التصوير بالفيديو في الإضاءة المنخفضة. يأتي Google Pixel 4 مع وضع Night Sight الذي يمكنه التقاط صور فوتوغرافية في نطاق لوكس 0.3-3 ، ويمكن أن يلتقط التصوير الفلكي سماء مظلمة بالنجوم. إلى جانب الوضع الليلي الذي ينشط تلقائيًا في الظلام ، Appleسيتكيف نظام Deep Fusion الجديد مع مستويات الإضاءة وينقل تصوير iPhone إلى مستوى أكثر إثارة للإعجاب.

حتى إذا لم يكن لديك فهم للتصوير الفوتوغرافي ، فستتمكن من التقاط صور رائعة بهذه smartphones.

5. زيادة الأمن والخصوصية

أصبح الامتثال للوائح العامة لحماية البيانات (GDPR) وقانون خصوصية المستهلك في كاليفورنيا (CCPA) أسهل مع التعلم الآلي على الجهاز. يضمن أمان البيانات ، حيث لا تحتاج إلى تحميل البيانات للقياسات الحيوية أو التشفير أو التسمية التوضيحية الحية إلى خادم أو سحابة للمعالجة.

يعد التشفير التلقائي على الجهاز ميزة أخرى مفيدة للهاتف الذكي تحمي المحتوى الخاص بك باستخدام رقم التعريف الشخصي أو كلمة المرور أو النمط وتسمح بالوصول إلى بياناتك فقط عندما تقوم بإلغاء قفل هاتفك. لذا ، إذا فقدت جهازك أو سرقته ، فإن فرصة حصول أي شخص على بياناتك لا تكاد تذكر.

تعد ميزة Face ID لجهاز iPhone أحد الأمثلة على تجربة الهاتف الذكي الأكثر أمانًا. الشبكات العصبية على الجهاز في Apple معالجة شرائح الهاتف الذكي وتخزين بيانات وجه المستخدم بأمان. يحدث التعريف على جهازك ، لذا تظل خصوصيتك وأمانك دون عوائق.

تستخدم تقنية Face Unlock في Google Pixel 4 ، التي تيسّرها شريحة Soli ، تعيين عمق 3D IR لإنشاء نماذج وجهك للتعرف على الوجوه وتخزينها على شريحة أمان Titan M6 على الجهاز. يعمل Face Unlock بشكل جيد مع تطبيق 1Password ليوفر للمستخدمين الأمان البيومتري من خلال القضاء على فرص الاحتيال في الهوية. لإعداد تطبيق 1Password على Pixel 4 ، ما عليك سوى إدخال التفاصيل الخاصة بك في الملء التلقائي واستخدام Face Unlock لتسجيل الدخول بدلاً من وظيفة Fingerprint Unlock.

6. دقة أكبر في التعرف على الصور

بإقران التعلم الآلي على الجهاز مع تقنية تصنيف الصور ، يمكنك تحديد المعلومات التفصيلية والحصول عليها في الوقت الفعلي حول أي شيء تواجهه تقريبًا. هل تريد قراءة نص بلغة أجنبية؟ امسحه ضوئيًا بهاتفك للحصول على ترجمة فورية ودقيقة. هل التقطت مجموعة أو قطعة أثاث خيالك؟ امسحه ضوئيًا للحصول على معلومات حول السعر ومكان شرائه. هل هناك طبق جديد مغري في قائمة المطاعم؟ يمكنك استخدام هاتفك لمعرفة مكوناته ومعلوماته الغذائية.

من خلال تسهيل التعرف على الصور في الوقت الفعلي ، تعمل تطبيقات مثل Google Lens و Calorie Mama و Leafsnap على زيادة قابلية الاستخدام والتعلم من أجهزة الجوال وتعزيز تجربة المستخدم.

إن إمكانيات التعلم الآلي على الجهاز هائلة. مع الخوارزميات الذكية المتزايدة الكفاءة ، والشبكات العصبية الأعمق ، وشرائح الذكاء الاصطناعي الأكثر قوة ، ستكون تطبيقات الهاتف المحمول ذات التعلم العميق قياسية في البنوك ، والتجزئة ، والرعاية الصحية ، وتحليلات البيانات ، وتكنولوجيا المعلومات ، والاتصالات ، والفضاء ، والعديد من الصناعات الأخرى. وفقًا لأبحاث السوق المعتمدة ، من المرجح أن يمس سوق التعلم العميق العالمي 26.64 مليار دولار بحلول عام 2026 ، مع وصول سوق تكنولوجيا شرائح التعلم العميق إلى 2.9 مليار دولار. مع استمرار تحسن قدرات التعلم العميقة ، ستتطور ميزات قابلية الاستخدام على الأجهزة المحمولة جنبًا إلى جنب وستغذي المزيد من الابتكارات.

ما رأيك في استخدام التعلم العميق لتحسين الأجهزة المحمولة؟ أخبرنا في التعليقات أدناه أو على Twitter، Facebookأو MeWe.


مقالات ذات صلة

Back to top button