الأخبار التكنولوجية والاستعراضات والنصائح!

كيف يمكّن الصوت محتوى الجيل التالي في smartphones

عن المؤلف

جيري هوبانيمي هو رئيس ترخيص التكنولوجيا في نوكيا تكنولوجيز

منذ إطلاق أول هاتف ذكي منذ أكثر من عقد من الزمان ، تخوض فرق البحث والتطوير والمهندسين والمصممين الصناعيين في معركة من الابتكار المتصاعد بسرعة متزايدة.

لقد شهد المستهلكون التقنيات في أجهزتهم تتغير بسرعة. لديهم الآن إمكانية الوصول إلى القدرات وقدرات الحوسبة التي كان يعتقد في الآونة الأخيرة أنه من غير الممكن تحقيقها في مثل هذا الشكل النحيف. نستخدم الآن الذكاء الاصطناعي يوميًا لإيجاد أفضل طريق للعمل. يمكننا بث أحدث الأفلام على الفور تقريبًا.

بعض أكبر قفزات إلى الأمام كانت في الكاميرا المدمجة في هذه الأجهزة. من الصور المحببة منذ ما يزيد قليلاً عن عقد من الزمان ، يمكننا الآن التقاط صور وفيديو بجودة 4K ، مع زيادة الذكاء الاصطناعي لإنتاج محتوى عالي الجودة.

على نحو متزايد ، استيقظت فرق البحث والتطوير على إمكانيات دمج التكنولوجيا الحسية المعززة في smartphones. يتضح هذا في الاتجاهات الحالية للألعاب الإلكترونية والألعاب ، ولكن أيضًا بشكل متزايد في أجهزة الاستشعار التقليدية مثل الميكروفونات. في حالة الصوت ، تتمثل إحدى المهام اليوم في مطابقة إمكانيات الصوت مع إمكانات التصوير والفيديو عالية الدقة في كاميرات اليوم.

قدرات الصوت فتح تجارب الجيل القادم

بعد إزالة مقبس الصوت التقليدي ، كانت الابتكارات في الصوت الذكي محدودة في السنوات الأخيرة.

على العموم ، كان التركيز على تحسين الجودة الشاملة. ومع ذلك ، فإن تجربة الصوت لم تتغير بشكل كبير منذ أيام Walkman أو مشغل MP3 – ستيريو في أحسن الأحوال ، ولكن لا يزال أحاديًا ، وبعض التحديد على ضبط التشغيل.

غالبًا ما يعتمد المستهلكون أيضًا على شراء أجهزة خارجية لتحسين وضوح التشغيل. في السنوات الأخيرة ، شهدنا اتجاهًا مرحبًا به في السماعات الذكية وتحسين جودة الكلام والصوت smartphones، والتي هي بوضوح خطوة في الاتجاه الصحيح.

معظم التحسينات التي أدخلت على صوت الجهاز اقتصرت إلى حد كبير على تشغيل المحتوى الاحترافي. هناك فرصة لفرق البحث والتطوير المبتكرة لإعادة التفكير في تجربة الصوت ومواءمتها مع ما يمكن تحقيقه من خلال التقاط الصور والفيديو.

من خلال دمج التقنيات الحسية والبرامج الذكية ، يمكن لصانعي الأجهزة إعادة تصميم تجربة الصوت بشكل جذري – مما يوفر مزيدًا من التحكم للمستخدمين حول كيفية التقاط الصوت. لنلقِ نظرة على مثالين:

  1. يمكن لخوارزميات الصوت الذكية التي تتيح التقاط الصوت المكاني أيضًا تمكين وظيفة تكبير الصوت. تعمل تمامًا مثل العدسة المقربة للصوت ، تتيح إمكانية التكبير للمستخدمين عزل مصدر الصوت المرغوب والاقتراب منه ، مما يؤدي إلى التخلص من الضوضاء غير المرغوب فيها ،
  2. يمكن أن تطلق نفس التقنيات أيضًا القدرة على تتبع مصادر الصوت المتحركة ديناميكيًا ، بالإضافة إلى الإلغاء التلقائي للأصوات غير المرغوب فيها ، مثل ضوضاء الرياح. حتى الآن ، يمكن تنفيذ التحرير اللاحق للمشهد الصوتي ، مما يتيح تحكمًا أكبر في المشهد الملتقط ، مما يخلق إمكانيات غير محدودة من الناحية العملية عندما يتعلق الأمر بكيفية سرد قصصنا.

تخيل أحد الوالدين الذي يحضر مسرحية طفلها في المدرسة. من الناحية التاريخية ، يجب أن تتصارع مع الصوتيات الضعيفة وتشتت انتباه أصوات الجمهور ، بينما تقبل أيضًا أن جودة الصوت الذي تم التقاطه ستقتصر على بعدك عن المسرح (ناهيك عن التسليم الصامت للممثلين الشباب العصبيين).

اليوم ، تقنيات الصوت المبتكرة قادرة على تخفيف هذه الظروف لتوفير قدرات لم يسبق لها مثيل للمستخدمين. في حين أن التقاط الصوت المكاني سيعيد إنتاج مشهد الصوت أثناء التشغيل ، إلا أنه لا يتغلب على مشكلة الضوضاء المحيطة ، كما أنه لا يسمح لك بالاقتراب من العمل. هذا هو المكان الذي تأتي فيه قدرات تكبير / تصغير الصوت والتتبع.

باستخدام واجهة كاميرا الهاتف الذكي ، يمكن للمستخدم الآن تكبير الصوت إلى جانب الفيديو ، مع القضاء في الوقت نفسه على الصوت المحيط بالمكان – خلط المقاعد ، والمحادثات في القاعة ، والأطفال الصغار في الجمهور. علاوة على ذلك ، يمكن للمرء اختيار الممثل الرئيسي وتتبعه ديناميكيًا ، مما يسمح بالتقاط أدائهم بتفاصيل كاملة ونابضة بالحياة وواضحة.

الزواج من الأجهزة والبرامج في مرحلة البحث والتطوير

يتم تحقيق هذه القدرات من خلال البرامج التي تعمل مع الأجهزة. لا يتطلب إعادة اختراع مهم لعوامل الشكل الحالية. ولكنه يتطلب علاقة وثيقة بين مهندسي الجهاز والمصممين.

من خلال العمل مع فريق التصميم ، يمكن لمهندسي البرمجيات وفرق البحث والتطوير مواءمة الخوارزميات التي تلتقط الصوت المكاني وفقًا للمواصفات الفريدة لعامل شكل الجهاز. هذه الشراكة الوثيقة مهمة ، حيث أن وضع الميكروفونات على الهاتف الذكي سيساهم في جودة التطبيقات الناتجة. كما ستقرر القدرات التي يمكن تحقيقها.

في حين أن الموضع الأمثل غير ممكن دائمًا دون المساس بعامل الشكل ، يمكن معالجة ذلك إلى حد كبير في مرحلة البحث والتطوير المبكرة. باستخدام قياسات المختبر الصوتي ، يمكن معايرة الخوارزميات الصوتية التي تعمل على تحليل ومعالجة إشارات الميكروفون المتعددة مع الموضع المحدد. هذا يقطع شوطا طويلا للحفاظ على سلامة عامل الشكل ويحدد أيضا ما هي القدرات التي يمكن إنشاؤها.

يجب أن تعمل هذه أيضًا بشكل متناغم مع القوة الحاسوبية للجهاز. يمكن أن يشمل ذلك التكامل مع محركات AI لتمكين التعرف على الكائنات للصوت ، مما يمنح المستخدمين القدرة على تركيز الصوت أو إزالة ضوضاء تشتيت الخلفية.

في حين أن إضفاء الطابع الديمقراطي على الوصول إلى الصوت الغامر هو نصف المعادلة ، فإن ضمان سهولة الاستخدام لهذه القدرات هو المكون الأساسي الآخر. تعد واجهة المستخدم الفعالة أحد الأصول الأساسية الأخرى – يجب أن تكون بديهية مثل كيفية استخدامنا لالتقاط الفيديو اليوم. مرة أخرى ، يجب على مصممي البرمجيات العمل عن كثب مع R&D والمهندسين لضمان سهولة استخدام هذه القدرات.

الحاجة إلى محتوى غامرة حقا

يجب أن تفكر الشركات المصنعة للأجهزة في سبب استخدام الناس للأجهزة وكيفية استخدامها smartphones للتواصل اليوم. في عالم رقمي مليء بالقنوات الاجتماعية التي نشارك فيها جميعًا حياتنا يوميًا ، لا يمكن المبالغة في أهمية التكنولوجيا التي نستخدمها لالتقاط ومشاركة اللحظات الأساسية.

يتضح هذا من حقيقة أن ما يقرب من 60 ٪ من مستخدمي الإنترنت يقومون بتحميل ومشاركة الفيديو عبر الإنترنت اليوم ، في حين أن حوالي 80 ٪ من جميع مشاهدي الفيديو الرقمي يستهلكون هذا المحتوى عبر smartphones.

لا ينبغي أن يكون تقديم تجارب جديدة حول الاستجابة للطلب. يجب أن يكون حول وضع معيار للابتكار. ينبغي أن يكون التركيز الأساسي لمصنعي الهواتف الذكية هو تمكين طرق أكثر وضوحًا للاتصال بالوسائط الرقمية ، سواء كان المحتوى المستخدم أو المحترف.

تطوير التقنيات الحسية التي تلتقط صورة حقيقية عن محيطنا هو مفتاح الحل. هذا لأنه عندما لا نكون منغمسين في بث أحدث المسلسلات التلفزيونية ، فنحن حكايات القصص. الأجهزة التي تسمح لنا بإنشاء مستويات جديدة من الانغماس وتعميق الاتصالات مع عائلتنا وأصدقائنا وجمهورنا الواسع ، تمكننا من سرد القصص.

من المرجح أن تظل الشركات المصنعة للأجهزة الأصلية التي تفهم دور الصوت في تقدم المحتوى الرقمي متقدمة على منافسيها. سوف يأخذون زمام المبادرة في تقديم المنتجات التي تقدم تمايزًا حقيقيًا في السوق.

هذا أمر بالغ الأهمية في إثبات المستقبل ضد الأشكال الجديدة للمحتوى الرقمي واتجاهات التكنولوجيا. تم تعيين تقنيات الهاتف المحمول الجديدة ، مثل 5G ، بالإضافة إلى القدرات المتطورة للواقع الافتراضي والمضاف إلى إطلاق المزيد من التجارب المثيرة. وستكون هذه التقنيات الصوتية المتقدمة عنصرا أساسيا في إيصالها.

جيري هوبانيمي هو رئيس ترخيص التكنولوجيا في تقنيات نوكيا.