الأخبار التكنولوجية والاستعراضات والنصائح!

تايلر ويتسمان ، المؤسس المشارك ورئيس الذكاء الاصطناعي في Speechify – سلسلة مقابلات

ستساعدك المقالة التالية: تايلر ويتسمان ، المؤسس المشارك ورئيس الذكاء الاصطناعي في Speechify – سلسلة مقابلات

Tyler Weitzman هو المؤسس المشارك ورئيس الذكاء الاصطناعي والرئيس في Speechify ، التطبيق رقم 1 لتحويل النص إلى كلام في العالم ، بإجمالي أكثر من 100000 تقييم 5 نجوم. Weitzman هو خريج جامعة ستانفورد ، حيث حصل على بكالوريوس في الرياضيات وماجستير في علوم الكمبيوتر في مسار الذكاء الاصطناعي. تم اختياره من قبل مجلة Inc. كأفضل 50 رائد أعمال ، وقد ظهر في Business Insider ، و TechCrunch ، و LifeHacker ، و CBS ، من بين منشورات أخرى. ركز بحث درجة الماجستير في Weitzman على الذكاء الاصطناعي وتحويل النص إلى كلام ، حيث حملت ورقته النهائية عنوان: “CloneBot: تنبؤات مخصصة للحوار والاستجابة”.

لقد بدأت البرمجة عندما كان عمرك 9 سنوات فقط ، ما الذي جذبك في البداية إلى علوم الكمبيوتر؟

كنت مهووسًا جدًا عندما كنت طفلاً مع Dragon Ball Z ، وأردت أن أتعلم تحريك نفسي. لقد تعلمت Adobe Flash و Photoshop ووضعت الرسوم المتحركة الخاصة بي لـ Goku على صفحة ويب للمعجبين قمت بإنشائها. كان ذلك بعد فترة وجيزة من بدء التعرف على الأنظمة والخوارزميات ، وعندما علمت أنه يمكنني بالفعل برمجة لقمة العيش التي كانت مثيرة للغاية. اعتقدت أنها مجرد هواية مثل ممارسة الألعاب.

لقد بدأت بعد ذلك في إنشاء تطبيقات iPhone عندما كان عمرك 12 عامًا فقط ، ما هي بعض هذه التطبيقات؟

أحد التطبيقات يسمى Black SMS الذي يسمح للأشخاص بإرسال رسائل نصية مشفرة لبعضهم البعض. تم تسمية تطبيق آخر باسم Frontback يتيح للمستخدمين التقاط صور سيلفي وصور لما أمامهم في نفس الوقت بالضبط.

هل يمكنك مناقشة بحثك في جامعة ستانفورد وكيف تمحور حول معالجة اللغة الطبيعية وتوليف الكلام؟

امتد بحثي إلى استخدامات متعددة لشبكات المحولات ، بما في ذلك نماذج إنشاء اللغة للدردشة ، وعلامات جزء من الكلام ، والتنبؤ بعلامات الترقيم ، وتحويل النص إلى كلام. كان تحسين استدلال الشبكة العصبية لوحدات المعالجة المركزية المحمولة هو التركيز الأساسي والذي تمت ترجمته مباشرة إلى الأصوات غير المتصلة المتاحة في Speechify ، والتي تعمل حتى في وضع الطائرة.

هل يمكنك مشاركة قصة التكوين وراء Speechify؟

أنا أعمى في عين واحدة وأخي كليف يعاني من عسر القراءة. لقد استخدمنا الكتب الصوتية وتقنية تحويل النص إلى صوت الكلام لطالما يمكننا تذكر تجاوز المدرسة وعندما كنا صغارًا لقراءة كتب مثل هاري بوتر. مع تقدمنا ​​في السن وبدأنا في استخدام المزيد من المنتجات التكنولوجية ، بدأنا ندرك أن هناك فرصة لإنشاء تطبيقات أفضل لتحويل النص إلى كلام على الويب والجوال بأصوات أفضل بفضل التطورات في الذكاء الاصطناعي وتجربة مستخدم أفضل. لذلك قررنا أن ندخلها ألقى خطابا.

ما هي بعض تقنيات التعلم الآلي المختلفة المستخدمة في Speechify؟

لقد اعتمدنا تقنيات متطورة للبنى التوليدية المتقدمة – المحولات / المطابقات ، والتدريب المسبق على نطاق واسع ، والتدريب الموزع ، وتراكم التدرج ، والمساحات الكامنة المشفرة تلقائيًا ، والانتشار ، والشبكات العدائية ، ونمذجة اللغة. نحن نستخدم تقنيات داعمة لمعالجة الميزات المحيطة بالصوتيات والنغمة والعاطفة ، لنمذجة الكلام بشكل أفضل على وجه التحديد.

ما هي بعض التحديات الكامنة وراء إنشاء تطبيق تحويل النص إلى كلام؟

التحدي الرئيسي هو البناء أصوات عالية الجودة هذا يبدو وكأنه بشر حقيقي وليس روبوتات. هدفنا هو عدم تمكن الأشخاص من معرفة الفرق بين صوت أصواتنا وطريقة صوت البشر ، بحيث يشعر المستخدمون بالراحة عند الاستماع إلى المحتوى على Speechify لفترات طويلة من الزمن. التحدي الثاني هو توزيع نماذج الذكاء الاصطناعي الخاصة بنا على ملايين المستخدمين. إن بناء أصوات ذكاء اصطناعي عالية الجودة أمر وشيء آخر هو التأكد من أن ملايين المستخدمين في جميع أنحاء العالم يتعرفون عليها بالفعل ويستخدمونها.

Speechify هو التطبيق رقم 1 في فئته في متجر التطبيقات ، إلى ماذا تنسب هذا النجاح؟

نعتقد أننا قمنا ببناء أفضل المنتجات في السوق للأشخاص الذين يرغبون في الاستماع إلى القراءة التي يحتاجون إليها – سواء أكانوا طلابًا لديهم واجبات منزلية ، أو محترفون يقرؤون للعمل ، أو قراء لقضاء وقت الفراغ يريدون الترفيه فقط. لدينا أفضل مجموعة مختارة من الأصوات ، بما في ذلك المشاهير مثل Snoop Dogg ، وأفضل واجهة مستخدم للأشخاص لتحميل المحتوى الذي يرغبون في استهلاكه والوصول إليه بسهولة. وتكون تجربة المستخدم لدينا سلسة عبر نظام Speechify – يمكنك البدء في الاستماع إلى ملف مقالة على جهاز الكمبيوتر الخاص بك ثم انطلق بسهولة للاحتفاظ به تستمع على هاتفك.

ما هي بعض أكبر حالات استخدام هذا التطبيق؟

Speechify’s الذكاء الاصطناعي التوليدي يحل مشاكل حقيقية للطلاب الذين يرغبون في إنجاز الكثير من الواجبات المنزلية بشكل أسرع ، والأشخاص الحقيقيون الذين يعانون من عسر القراءة واضطراب فرط الحركة ونقص الانتباه والذين يعانون من صعوبة في القراءة ، وكبار السن ضعاف البصر ، والمهنيين الذين يرغبون في قراءة المزيد وأن يكونوا أكثر إنتاجية ، والكتاب الذين يرغبون في الاستماع إلى عملهم والمتعلمون السمعيون وعدد لا يحصى من الآخرين.

ما هي رؤيتك لمستقبل الذكاء الاصطناعي؟

نريد الذكاء الاصطناعي – وعلى وجه التحديد نص AI إلى أصوات الكلام – لإزالة العوائق التي تحول دون التعلم بغض النظر عن مستوى دخلك أو اختلافات التعلم أو الجغرافيا أو اللغة. نحن نرى الذكاء الاصطناعي كأداة للصالح الاجتماعي لرفع جودة الحياة التي يمكن أن يعيشها البشر من خلال تحسين تعليمهم.