الأخبار التكنولوجية والاستعراضات والنصائح!

استنسخ هذا الذكاء الاصطناعي صوتي باستخدام ثلاث دقائق فقط من الصوت

ستساعدك المقالة التالية: استنسخ هذا الذكاء الاصطناعي صوتي باستخدام ثلاث دقائق فقط من الصوت

هناك مشهد قد تتذكره. في ذلك ، يتعامل بطلنا إيثان هانت (توم كروز) مع شرير الفيلم ، ويحتجزه تحت تهديد السلاح ، ويجبره على قراءة سلسلة غريبة من الجمل بصوت عالٍ.

“يقرأ على مضض.”

على الرغم من أنها تبدو عشوائية وغير مهمة ، إلا أنه سرعان ما يتضح أن الكلمات التي يقرأها ليست عشوائية على الإطلاق – فهي مصممة عن عمد لمساعدة برنامج على استنساخ صوته. بمجرد الانتهاء من المقطع ، يقوم البرنامج بتحليل الصوت ويمنح Hunt على الفور القدرة على التحدث والصوت تمامًا مثل الرجل السيئ – الجزء الأخير من تمويهه شبه المثالي.

المهمة: المستحيل 3 (2006) – رؤية مشهد مزدوج (5/8) | لقطات الفيلم

الآن إذا أخذت هذا المشهد وطرح كل التجسس والأسلحة والتوتر الدراماتيكي ، فسيتبقى لك مثال قوي جدًا لما جربته في CES اليوم خلال عرض توضيحي لـ My Own Voice ، وهو “خدمات مصرفية صوتية” مدعومة بالذكاء الاصطناعي خدمة من شركة فرنسية ناشئة تسمى Acapela Group.

سبب وجود الشركة هو مساعدة الأشخاص الذين سيفقدون القدرة على الكلام في النهاية. يحدث هذا عادةً نتيجة للإصابة أو المرض أو الأمراض مثل ALS ومرض هنتنغتون وسرطان الحنجرة. مهما كان السبب ، تسمح منصة My Own Voice الخاصة بالشركة لأي شخص باستنساخ صوته صناعياً والحفاظ على النغمة الفريدة والجرس والشخصية التي تجعله صوته – وهو شيء يضيع عادةً مع معظم برامج تحويل النص إلى كلام (أعتقد ستيفن هوكينج).

لكي نكون منصفين ، فإن تقنية استنساخ الصوت ليست بالضرورة جديدة أو رائدة من الناحية التكنولوجية في هذه المرحلة. هذه الخدمات موجودة منذ سنوات ، ويرجع الفضل في ذلك جزئيًا إلى ظهور تقنية التزييف العميق ، وهناك حاليًا العشرات من الشركات الأخرى التي يمكنها فعل الشيء نفسه الذي تقوم به مجموعة Acapela. ولكن هناك شيئان كبيران يميزان My Own Voice عن باقي المجموعة: السرعة والغرض.

صوتي الخاص سريع بشكل مثير للإعجاب. على عكس الخدمات الأخرى ، التي تتطلب غالبًا ساعات من الصوت المرجعي لإنشاء استنساخ واقعي ، يمكن للذكاء الاصطناعي الخاص بـ My Own Voice إنشاء تركيبة جيدة بشكل مذهل بعد سماع 50 جملة قصيرة فقط ، أو ما يقرب من 3 دقائق من الصوت المسجل. إنه في الأساس مثل مشهد المهمة المستحيلة. لقد طوروا مجموعة مبسطة من الجمل المرجعية التي تسهل على الذكاء الاصطناعي الخاص بهم التعرف على صوتك ، لذلك بدلاً من التسجيل اليدوي لكل كلمة يمكن تصورها ، كل ما عليك فعله هو التحدث من خلال مجموعة من العبارات السهلة.

يمكن القول إن أهم من سرعة البرنامج هو الغرض منه. مرة أخرى ، هذه التقنية ليست جديدة أو جديدة بشكل خاص. كان هناك عدد قليل من الشركات الناشئة الجديرة بالملاحظة التي طورت تقنية مماثلة لاستنساخ الصوت – مثل الشركة الكندية الناشئة Lyrebird أو شركة Sonantic ومقرها لندن ، على سبيل المثال. ولكن تم الاستحواذ على هاتين الشركتين الناشئتين بسرعة ، وانتهى الأمر باستخدام تقنية استنساخ الصوت الخاصة بهما في الدبلجة الزائدة للذكاء الاصطناعي في الأفلام وبرامج تحرير الفيديو.

هذا لا يعني أن هذه ليست استخدامات جيدة لتقنية استنساخ الصوت. إنها كذلك تمامًا ، وربما تكون مربحة جدًا للإقلاع – ولكن هذا بالضبط ما يجعل My Own Voice رائعًا للغاية. غالبًا ما تواجه مثل هذه التكنولوجيا القوية التي تم تطويرها خصيصًا لمساعدة الأشخاص المحرومين ومنحهم صوتًا حرفيًا ، بدلاً من كونها مصممة للترفيه أو الإنتاجية.