الأخبار التكنولوجية والاستعراضات والنصائح!

بافيل أوسوكين ، الشريك المؤسس والرئيس التنفيذي لشركة AMAI – سلسلة مقابلات

ستساعدك المقالة التالية: بافيل أوسوكين ، الشريك المؤسس والرئيس التنفيذي لشركة AMAI – سلسلة مقابلات

بافيل أوسوكين هو الشريك المؤسس والرئيس التنفيذي لشركة AMAI، وهي شركة ناشئة مقرها سان فرانسيسكو تنتج محركات صوت AI. يقود Pavel عملية واستراتيجية Amai بطموح احترافي لتثبيت تقنية الصوت الخاصة به في كل هاتف في العالم. في AMAI قاموا بتطوير صوت ذكاء اصطناعي لا يمكن تمييزه من خطاب بشري حقيقي من قبل 97٪ من المستخدمين.

لقد كنت رائد أعمال مدى الحياة بعد أن أطلقت شركتك الأولى في سن 13 ، ما هي محاولتك الأولى في العمل وما الذي تشعر أنه دافع لعقلية ريادة الأعمال هذه؟

لم أسميها حقًا شركة ، لكنني جنيت نقودي الأول من خلال إعادة بيع بعض الأشياء أو مجرد غسل السيارات في الشارع بدلو. كان دافعي هو أنني كنت أرغب في تناول مشروب كولا أو سنيكرز ، ولم يكن والداي يملكان أي أموال. يمكنني إما انتظار ظهور المال أو كسبه بنفسي. الانتظار لا يروق لي.

هل يمكنك مشاركة قصة التكوين وراء AMAI؟

سألت شريكي ، “ماذا تحتاج الشركات حول العالم؟” في تلك المحادثة ، أدركت أن كل شركة تبحث عن “بيع”. بدأنا في صنع روبوتات يمكن أن تتوافق مع العملاء وتبيع المنتجات عبر البريد والمراسلة. من ناحية أخرى ، لم يكن شيئًا جديدًا بشكل خاص نظرًا لوجود العديد من برامج الدردشة المتاحة. لذلك ، اعتقدنا أنه إذا كان بإمكان هذه الروبوتات إجراء مكالمات ، فسيكون ذلك رائعًا. نظرًا لوجود عدد قليل من الحلول الجيدة في السوق ، فقد أنشأنا نموذجًا أوليًا لصوتنا المركب ، وبعد المبيعات الأولى ، تخلينا عن الروبوت وركزنا على تحويل النص إلى كلام.

ما الذي ترمز إليه AMAI على وجه التحديد؟

هذا يعني أنا AI (أنا ذكاء اصطناعي).

هل يمكنك مناقشة بعض التحديات الكامنة وراء تصميم أحدث تقنيات تحويل النص إلى كلام؟

يقدم تصميم تحويل النص إلى كلام المتطور العديد من التحديات. الأول هو جمع مجموعات البيانات. يتطلب تدريب شبكة عصبية أصواتًا من الإناث والذكور من مختلف الأعمار ، وكلما كان ذلك أفضل ، كان ذلك أفضل. ثانيًا ، تحتاج إلى تحقيق تشابه كبير جدًا مع الصوت الطبيعي. أفضل طريقة هي اختبار نماذج مختلفة للتعلم الآلي والتجربة باستمرار مع حالات مختلفة من استخدام الصوت: على وجه الخصوص ، تحتاج إلى العثور على العينة الأكثر إشكالية ومعالجتها بشكل منفصل. عند الحديث عن التحديات طويلة المدى ، قد يكون من الصعب تقييم ما إذا كان الصوت قد أصبح أفضل أم أسوأ ، وفي أي اتجاه ينبغي تحسينه.

ما هي بعض التحديات الكامنة وراء التعرف على الكلام عندما يتعلق الأمر بتفاعل البشر مع AMAI voice AI؟

هناك المئات من الشركات التي تعمل على التعرف على الصوت لأنها أسهل في التطوير. المشكلة التي ليس لها حل حاليًا هي التعرف على صوت الطفل. يتمتع الأطفال بالعديد من خصائص الكلام في سن مبكرة ، لذلك يصعب أخذها جميعًا في الاعتبار. ومع ذلك ، كنا نعمل على إيجاد حل لهذه المشكلة ، ونحن قريبون جدًا من إعلان النتيجة – قريبًا ، لن يواجه الذكاء الاصطناعي لدينا أي مشاكل في التفاعل ليس فقط مع البالغين ، ولكن أيضًا مع الأطفال.

ما هي بعض حالات الاستخدام الشائعة لـ AMAI؟

في الوقت الحالي ، يتم استخدام الدبلجة الصوتية واستخدام المؤسسات في مراكز الاتصال.

ما اللغات المتوفرة حاليًا وما هي اللغات التي يتم العمل عليها حاليًا؟

يتضمن نظامنا متعدد السماعات لغتين ، الروسية والإنجليزية. الفكرة هي أن الصوت الذي تم إنشاؤه بلغة واحدة يمكنه التحدث بجميع اللغات الأخرى في نموذجنا أيضًا. في الوقت الحالي ، نقوم بجمع البيانات لـ 40 لغة أخرى ، وقريبًا جدًا سيكون لدينا 42 لغة.

ما هي رؤيتك لمستقبل المساعدين الصوتيين بالذكاء الاصطناعي؟

في اعتقادي أن المساعدين الصوتيين سينتقلون إلى الاتجاه المعاكس ، ونحن ندرس هذه الفرص الآن. إذا قمت بدمج المساعد مع مكبرات الصوت الذكية أو متصفح الويب ، فسيستخدم المزيد من الأشخاص البحث الصوتي ويتفاعلون مع المساعد كل يوم. يمكنك التحدث إلى الثلاجة أو التلفزيون.

هل هناك أي شيء آخر تود مشاركته حول AMAI؟

تستخدم AMAI تقنياتها الخاصة فقط.