الأخبار التكنولوجية والاستعراضات والنصائح!

البحث الصوتي من Google – هل سيكون ممكنًا على الإطلاق؟

ستساعدك المقالة التالية: البحث الصوتي من Google – هل سيكون ممكنًا على الإطلاق؟

هل سيكون من الممكن لـ Google إنشاء فهرس للمحتوى الصوتي الذي يمكن للمستخدمين البحث فيه مثل صفحات الويب؟

تشير نتائج الاختبار المبكر، التي نشرتها جوجل في مقال على مدونة، إلى أن البحث الصوتي أصعب مما قد يبدو.

تمت مشاركة تفاصيل هذه الاختبارات في مقال كتبه تيم أولسون، نائب الرئيس الأول للشراكات الاستراتيجية الرقمية في KQED.

تتعاون Google مع KQED في جهد مشترك لتسهيل العثور على الصوت.

بمساعدة KUNGFU.AI، موفر خدمات الذكاء الاصطناعي، أجرت Google وKQED اختبارات لتحديد كيفية نسخ الصوت بطريقة سريعة وخالية من الأخطاء.

وهنا ما اكتشفوه.

صعوبات البحث الصوتي

أكبر عائق أمام جعل البحث الصوتي ممكنًا هو حقيقة أنه يجب تحويل الصوت إلى نص قبل أن يتم البحث عنه وفرزه.

لا توجد حاليًا طريقة لنسخ الصوت بدقة بطريقة تسمح بالعثور عليه بسرعة.

الطريقة الوحيدة التي يمكن بها البحث الصوتي على نطاق عالمي هي من خلال النسخ الآلي. قد يستغرق النسخ اليدوي وقتًا وجهدًا كبيرين بعيدًا عن الناشرين.

ويشير أولسون من KQED إلى أن معيار الدقة يجب أن يكون مرتفعًا بالنسبة للنسخ الصوتي، خاصة عندما يتعلق الأمر بفهرسة الأخبار الصوتية. إن التقدم الذي تم إحرازه حتى الآن في تحويل الكلام إلى نص لا يفي حاليًا بهذه المعايير.

حدود تكنولوجيا تحويل الكلام إلى النص الحالية

أجرت Google اختبارات باستخدام KQED وKUNGFU.AI من خلال تطبيق أحدث أدوات تحويل الكلام إلى نص على مجموعة من الأخبار الصوتية.

تم اكتشاف قيود في قدرة الذكاء الاصطناعي على تحديد أسماء العلم (المعروفة أيضًا بالكيانات المسماة).

تحتاج الكيانات المسماة في بعض الأحيان إلى سياق لفهمها ليتم تحديدها بدقة، وهو ما لا يتوفر لدى الذكاء الاصطناعي دائمًا.

يقدم أولسون مثالاً لأخبار KQED الصوتية التي تحتوي على خطاب مليء بالكيانات المسماة التي تعتبر سياقية لمنطقة الخليج:

“إن الأخبار الصوتية المحلية لـ KQED غنية بمراجع الكيانات المسماة المتعلقة بالموضوعات والأشخاص والأماكن والمنظمات ذات الصلة بمنطقة الخليج. يستخدم المتحدثون اختصارات مثل “CHP” لدورية الطرق السريعة في كاليفورنيا و”شبه الجزيرة” للمنطقة الممتدة من سان فرانسيسكو إلى سان خوسيه. ومن الصعب على الذكاء الاصطناعي التعرف عليها.

عندما لا يتم فهم الكيانات المسماة، يقوم الذكاء الاصطناعي بأفضل تخمين لما قيل. ومع ذلك، يعد هذا حلاً غير مقبول لبحث الويب، لأن النسخ غير الصحيح يمكن أن يغير المعنى الكامل لما قيل.

ماذا بعد؟

سيستمر العمل في البحث الصوتي مع خطط لجعل التكنولوجيا متاحة على نطاق واسع عند تطويرها.

يقول ديفيد ستولر، الشريك الرئيسي للأخبار والنشر في Google، إنه سيتم مشاركة التكنولوجيا بشكل مفتوح عند اكتمال العمل في هذا المشروع.

“أحد ركائز مبادرة Google الجديدة هو احتضان أساليب جديدة لحل المشاكل الصعبة. وبمجرد اكتمالها، سيتم مشاركة هذه التكنولوجيا وأفضل الممارسات المرتبطة بها بشكل مفتوح، مما يؤدي إلى توسيع التأثير المتوقع بشكل كبير.

يقول أولسون من KQED إن نماذج التعلم الآلي اليوم لا تتعلم من أخطائها، وهو ما قد يحتاج البشر إلى التدخل فيه.

والخطوة التالية هي اختبار حلقة ردود الفعل حيث تساعد غرف الأخبار على تحسين نماذج التعلم الآلي من خلال تحديد أخطاء النسخ الشائعة.

“نحن واثقون من أن التحسينات في نماذج تحويل الكلام إلى نص ستساعد في المستقبل القريب في تحويل الصوت إلى نص بشكل أسرع، مما يساعد الأشخاص في النهاية في العثور على الأخبار الصوتية بشكل أكثر فعالية.”

مصدر: جوجل