الأخبار التكنولوجية والاستعراضات والنصائح!

قابل XTREME-UP: معيار لتقييم النماذج متعددة اللغات مع تقييم البيانات النادرة ، مع التركيز على اللغات غير الممثلة

ستساعدك المقالة التالية: قابل XTREME-UP: معيار لتقييم النماذج متعددة اللغات مع تقييم البيانات النادرة ، مع التركيز على اللغات غير الممثلة

تعتمد مجالات الذكاء الاصطناعي والتعلم الآلي على البيانات فقط. يتم إغراق الجميع بالبيانات من مصادر مختلفة مثل وسائل التواصل الاجتماعي والرعاية الصحية والتمويل وما إلى ذلك ، وهذه البيانات ذات فائدة كبيرة للتطبيقات التي تتضمن معالجة اللغة الطبيعية. ولكن حتى مع وجود الكثير من البيانات ، فإن البيانات سهلة الاستخدام نادرة لتدريب نموذج البرمجة اللغوية العصبية لمهمة معينة. يعد العثور على بيانات عالية الجودة ذات فائدة وفلاتر عالية الجودة مهمة صعبة. عند الحديث على وجه التحديد عن تطوير نماذج البرمجة اللغوية العصبية للغات مختلفة ، يأتي نقص البيانات لمعظم اللغات بمثابة قيد يعيق التقدم في البرمجة اللغوية العصبية للغات منخفضة التمثيل (ULs).

تعتمد المهام الناشئة مثل تلخيص الأخبار ، أو تحليل المشاعر ، أو الإجابة على الأسئلة ، أو تطوير مساعد افتراضي ، اعتمادًا كبيرًا على توفر البيانات بلغات عالية الموارد. تعتمد هذه المهام على تقنيات مثل التعرف على اللغة ، أو التعرف التلقائي على الكلام (ASR) ، أو التعرف الضوئي على الأحرف (OCR) ، والتي لا تتوفر في الغالب للغات قليلة التمثيل ، للتغلب على ما هو مهم لبناء مجموعات البيانات وتقييم النماذج على المهام التي سيكون مفيدًا لمتحدثي UL.

في الآونة الأخيرة ، اقترح فريق من الباحثين من GoogleAI معيارًا يسمى XTREME-UP (تمثيل ناقص ومرتكز على المستخدم مع بيانات Paucal) يقوم بتقييم النماذج متعددة اللغات في المهام التي تتمحور حول المستخدم في إعداد تعليمي قليل اللقطات. يركز بشكل أساسي على الأنشطة التي غالبًا ما يؤديها مستخدمو التكنولوجيا في حياتهم اليومية ، مثل الوصول إلى المعلومات وأنشطة الإدخال / الإخراج التي تمكن التقنيات الأخرى. السمات الرئيسية الثلاث التي تميز XTREME-UP هي – استخدامها للبيانات النادرة ، وتصميمها المرتكز على المستخدم ، وتركيزها على اللغات الأقل تمثيلاً.

مع XTREME-UP ، قدم الباحثون إعدادًا موحدًا متعدد اللغات للضبط الدقيق للغة بدلاً من خيار اللقطة الصفرية التقليدي متعدد اللغات. تأخذ هذه الطريقة في الاعتبار مقدار البيانات التي يمكن إنشاؤها أو التعليق التوضيحي في فترة 8 ساعات للغة معينة ، وبالتالي تهدف إلى منح ULs إعداد تقييم أكثر فائدة.

يقوم XTREME-UP بتقييم أداء النماذج اللغوية عبر 88 لغة غير ممثلة في 9 تقنيات مهمة تركز على المستخدم ، وبعضها يتضمن التعرف التلقائي على الكلام (ASR) ، والتعرف البصري على الأحرف (OCR) ، والترجمة الآلية (MT) ، والوصول إلى المعلومات المهام التي لها فائدة عامة. طور الباحثون مجموعات بيانات جديدة خصيصًا لعمليات مثل التعرف الضوئي على الحروف والإكمال التلقائي والتحليل الدلالي والتحويل الصوتي من أجل تقييم قدرات النماذج اللغوية. لقد قاموا أيضًا بتحسين وصقل مجموعات البيانات الموجودة حاليًا لمهام أخرى في نفس المعيار.

تتمتع XTREME-UP بإحدى قدراتها الرئيسية لتقييم مواقف النمذجة المختلفة ، بما في ذلك سيناريوهات نصية فقط ومتعددة الوسائط مع مدخلات مرئية وصوتية ونصية. كما يوفر طرقًا لتعديل المعلمات تحت الإشراف والتعلم في السياق ، مما يسمح بإجراء تقييم شامل لنهج النمذجة المختلفة. تتضمن المهام في XTREME-UP تمكين الوصول إلى تقنية اللغة ، وتمكين الوصول إلى المعلومات كجزء من نظام أكبر مثل الإجابة على الأسئلة ، واستخراج المعلومات ، والمساعدين الافتراضيين ، متبوعًا بإتاحة المعلومات بلغة المتحدث.

وبالتالي ، يعد XTREME-UP معيارًا رائعًا يعالج تحدي ندرة البيانات في أنظمة البرمجة اللغوية العصبية متعددة اللغات. إنه إطار تقييم موحد للغة ناقصة التمثيل ويبدو مفيدًا حقًا لأبحاث وتطورات البرمجة اللغوية العصبية في المستقبل.