الأخبار التكنولوجية والاستعراضات والنصائح!

أهم الأوراق المقدمة في DLDC 2021

ستساعدك المقالة التالية: أهم الأوراق المقدمة في DLDC 2021

في الشهر الماضي ، اختتمت رابطة علماء البيانات (ADaSci) ، بالشراكة مع مجلة Analytics India (AIM) ، إصدار 2021 لمدة يومين من مؤتمر مطوري التعلم العميق (DLDC). عقد المؤتمر عمليا في 23-24 سبتمبر. شارك في مؤتمر التعلم العميق 30 متحدثًا رئيسيًا وأكثر من 500 مشارك. بالإضافة إلى ذلك ، قدم بعض المحترفين والباحثين البارزين من مؤسسات مرموقة محادثاتهم المميزة وأوراقهم البحثية.

قدم اليوم الثاني من المؤتمر منصة لتقديم أوراق بحثية قيمة في مجال التعلم الآلي. يتم نشر جميع الأوراق المقبولة في مجلة Lattice – وهي مجلة دولية محكمة ومراجعة محكمة عن التعلم الآلي ، وتستضيفها وتديرها جمعية علماء البيانات (ADaSci). لنستعرض بعض أهم الأوراق البحثية التي تم تقديمها في مؤتمر DLDC 2021:

1 | العنوان: استخلاص التعبير الزمني وتطبيعه في الظروف الصناعية

بواسطة: بيوش أرورا ، باحث أول في الذكاء الاصطناعي في مختبرات أمريكان إكسبريس للذكاء الاصطناعي

عن: قدم كبير الباحثين في منظمة العفو الدولية TEEN – وهو حل من الدرجة الصناعية لمشكلة استخراج تعبيرات الوقت والتطبيع (Timex). يعد استخراج الوحدات الزمنية وتطبيعها مشكلة صعبة بسبب عدة عوامل:

  • قد يتم التعبير عن وحدات الوقت نفسها أحيانًا بطرق مختلفة ،
  • الغموض المتأصل في اللغات الطبيعية يؤدي إلى تفسيرات متعددة ، و
  • طبيعة اللغات الطبيعية الحساسة للسياق.

في حين أن العديد من المناهج الأكاديمية والصناعية قد قدمت حلولًا تجاه Timex ، فإن بناء حل القوة الصناعية ينطوي على تحديات إضافية في شكل توقعات المستخدم ، والحاجة إلى تقديم دقة عالية ، ونقص في هيئة التدريب. علاوة على ذلك ، أوضح بيوش كيف يخفف TEEN من هذه التحديات بعناية. أوضح كيف يقارن النهج المقترح مع مختلف خطوط الأساس الحديثة على البيانات النصية من صناعة التمويل. “قمنا أيضًا بتصنيف أوجه القصور في خطوط الأساس هذه في بيئة صناعية. أخيرًا ، نقدم رؤى تم جمعها من خلال الملاحظات التي قدمناها والدروس التي تعلمناها أثناء تصميم TEEN للعمل في بيئة صناعية ، “قال Piyush.

2 | العنوان: تصنيف الكوازارات والمجرات والنجوم باستخدام التعلم العميق متعدد الوسائط

بواسطة: بهارات كومار بولا ، كبير علماء البيانات في Verizon

عن: كما نعلم جميعًا ، الكون هو الامتداد الشاسع للفضاء الكوني الذي يتكون من بلايين المجرات. تتكون المجرات من بلايين النجوم التي تدور حول مركز جاذبية الثقب الأسود. الكوازارات هي أجسام شبه نجمية تنبعث منها إشعاعات كهرومغناطيسية أقوى من لمعان المجرات مجتمعة.

في هذه الورقة ، تم استخدام الإصدار الرابع ، مسح سلون الرقمي للسماء (SDSS-4) ، مجموعة بيانات إصدار البيانات 16 ، لتصنيف مجموعة بيانات SDSS إلى مجرات ونجوم وأشباه نجوم باستخدام التعلم الآلي وبنى التعلم العميق. يستخدم الباحثون بكفاءة كلاً من الصورة والبيانات الوصفية في تنسيق جدولي لبناء بنية جديدة متعددة الوسائط وتحقيق نتائج متطورة. بالنسبة للبيانات المجدولة ، قارنوا خوارزميات تعلم الآلة الكلاسيكية (الانحدار اللوجستي ، الغابة العشوائية ، أشجار القرار ، Adaboost ، LightGBM ، إلخ) مع الشبكات العصبية الاصطناعية. بالإضافة إلى ذلك ، تم استخدام بنية التعلم العميق مثل Resnet50 و VGG16 و EfficientNetB2 و Xception و Densenet121 للصور. تلقي أعمالنا ضوءًا جديدًا على التعلم العميق متعدد الوسائط مع قدرتها على التعامل مع مجموعات بيانات الصف غير المتوازنة. أدت البنية متعددة الوسائط أيضًا إلى مقاييس أعلى (الدقة ، الدقة ، الاسترجاع ، درجة F1) من النماذج التي تستخدم الصور أو البيانات المجدولة فقط.

3 | العنوان: التحديد المفرط للتسريبات في الأنابيب وأنظمة الكابلات باستخدام التعلم المعزز

بواسطة: إندراجيت كار ، رئيس قسم الذكاء الاصطناعي في شركة سيمنز أدفانتا

عن: كانت التسريبات بلا شك واحدة من أكبر المشكلات التي تعاني منها أنظمة الأنابيب والكابلات عبر الصناعات مثل الكهرباء والطاقة والبناء والمدن الذكية والنفط والغاز وما إلى ذلك. تصبح معالجة هذه التسريبات في الوقت المناسب أمرًا بالغ الأهمية حيث يؤدي الفشل إلى توقف كامل في سلسلة النقل . لسوء الحظ ، فشلت معظم أنظمة الكشف عن التسريب القائمة على الذكاء الاصطناعي في الوصول إلى حالة النشر لأن هذه الأنظمة عرضة لإخراج إيجابيات خاطئة. من الضروري ملاحظة أن هذه التسريبات لا تحدث كل يوم ؛ أو بعبارة أخرى ، إنها أحداث نادرة. ولكن عندما تحدث ، فإن هذه التسريبات تمر في كثير من الأحيان دون أن يلاحظها أحد. نظرًا للعدد غير الكافي من نقاط التسرب المحددة ، يصبح من الصعب بناء نموذج قائم على الذكاء الاصطناعي.

في محاولة لمساعدة / استبدال أنظمة الكشف عن التسرب القائمة على القواعد والفيزياء ، تقترح هذه الورقة حلاً جديدًا للكشف عن التسرب قائم على الذكاء الاصطناعي باستخدام التعلم المعزز الذي لا يقلل فقط من الإيجابيات الكاذبة بل يمتد أيضًا إلى التسرب القائم على ماكينات الألعاب المتعددة الموقع. باستخدام هذه المنهجية ، نقوم بنمذجة السلوك الكامن لأي أنظمة أنابيب أو كابلات ونقدم توصية بأقصر مسار تعتمد على Q-Learning لمساعدة فريق الصيانة على الوصول إلى عقدة التسرب في فترة زمنية قصيرة.

4 | العنوان: تفسيرات عالمية ومحلية قابلة للتحجيم باستخدام شجرة النموذج الخطي

بواسطة: نارايانان أوني إي ، رئيس أبحاث التعلم الآلي ، مختبر أمريكان إكسبريس للذكاء الاصطناعي

عن: مع الاستخدام المتزايد باستمرار لنماذج التعلم الآلي المعقدة في التطبيقات الهامة ، أصبح شرح قرارات النموذج ضروريًا. مع التطبيقات التي تمتد من تسجيل الائتمان إلى الرعاية الصحية ، فإن تأثير هذه النماذج لا يمكن إنكاره.

في هذه الورقة ، توصل الباحثون إلى خط أنابيب جديد لبناء التفسيرات. يتم استخدام GAN لتوليد البيانات التركيبية ، بينما يتم استخدام نموذج خطي متعدد التعريف في شكل أشجار النموذج الخطي كنموذج بديل. عندما يتم الجمع بين هاتين الطريقتين ، فإنها توفر بنية بيانات قوية قادرة على شرح نماذج ML المعقدة. بالإضافة إلى ذلك ، فإن الحداثة في بنية البيانات هذه هي أنها توفر شرحًا في شكل قواعد القرار وخصائص الميزات. علاوة على ذلك ، تمكن بنية البيانات الباحثين أيضًا من بناء نموذج تفسير عالمي ، يكون فعالًا من الناحية الحسابية ، بحيث يتسع مع كميات كبيرة من البيانات.

5 | العنوان: توقع مقاييس أداء الإعلان المخصص باستخدام الميزات السياقية

بواسطة: براتيك كولكارني ، رئيس فريق علوم البيانات في MiQ Digital ؛ Divyaprabha M ، عالم البيانات في MiQ Digital

عن: تقترح هذه الورقة نهجًا قائمًا على التعلم الآلي للتنبؤ بأداء الحملة الإعلانية في المستقبل من خلال التركيز على الميزات السياقية مثل المتصفح ونظام التشغيل ونوع الجهاز وما إلى ذلك.

  • أولاً ، تم تطوير مقياس مخصص يشمل التكلفة والأداء وتسليم الحملة. تُستخدم القيمة المتوقعة لهذا المقياس للتسجيل والتوصية باستراتيجيات الاستهداف. لإنشاء ميزات جديدة ، يتم إعداد تقنيات هندسة الميزات (دليل CMO للشراء الآلي ، nd) مثل إنشاء ميزة التأخير والتشفير الإحصائي والتضمينات القائمة على الرسوم البيانية لمواقع الويب وتشفير الميزات الدورية للمهام النهائية مثل التنبؤ CTR.
  • تقارن هذه الورقة بعد ذلك وتختار أفضل نماذج التعلم الخطي والقائم على الأشجار والعميقة أداءً لفرضياتنا المقترحة.
  • أخيرًا ، قاموا بتطوير معايير الكشف عن مجريات الأمور للاختبار دون اتصال بالإنترنت للاستراتيجيات الموصى بها وحساب رفع الأداء النظري مقارنة بمنهجيات درجات التصنيف الأقدم ، والتي تكون بمثابة نتائج أساسية لدينا. يتفوق الحل المقترح على الحل الأساسي ويقترح طريقة جديدة للتوصية بالاستراتيجيات.

6 | العنوان: تحليل الربحية القطاعية لسوق الأسهم الهندية باستخدام نموذج الانحدار LSTM

بواسطة: جايدب سين ، أستاذ علوم البيانات والذكاء الاصطناعي في كلية براكسيس للأعمال

عن: لطالما كان تصميم النموذج التنبئي للتنبؤ الدقيق لأسعار الأسهم المستقبلية مشكلة بحثية مثيرة للاهتمام وصعبة. تصبح المهمة معقدة بسبب الطبيعة المتقلبة والعشوائية لأسعار الأسهم في العالم الحقيقي ، والتي تتأثر بالعديد من المتغيرات التي يمكن التحكم فيها والتي لا يمكن السيطرة عليها.

تقدم هذه الورقة نموذجًا تنبئيًا محسنًا مبنيًا على بنية الذاكرة طويلة وقصيرة المدى (LSTM) لاستخراج أسعار الأسهم السابقة تلقائيًا من الويب خلال فترة زمنية محددة ، والتنبؤ بأسعارها المستقبلية لأفق توقع محدد ، وتوقع المخزون المستقبلي الأسعار. يتم نشر النموذج لإجراء المعاملات وشرائها وبيعها بناءً على نتائجه المتوقعة لـ 70 سهماً هاماً من سبعة قطاعات مختلفة مدرجة في البورصة الوطنية الهندية (NSE). أولاً ، يتم اشتقاق ربحية كل قطاع بناءً على إجمالي الربح الذي حققته الأسهم في هذا القطاع خلال الفترة من 1 يناير 2010 إلى 26 أغسطس 2021. ثم تتم مقارنة القطاعات بناءً على قيم ربحيتها. يتم أيضًا تقييم دقة التنبؤ بالنموذج لكل قطاع. تشير النتائج إلى أن النموذج دقيق للغاية في التنبؤ بأسعار الأسهم المستقبلية.

تغليف

لا يغطي مؤتمر DLDC كل جانب من جوانب التعلم العميق فحسب ، بل يشجع الباحثين على ابتكار أوراق بحثية رائدة لتقديمها. يهدف ADaSci’s Lattice إلى نشر مقالات بحثية عالية الجودة من الباحثين والممارسين في علوم البيانات والتعلم الآلي. قبل نشرها ، تمر جميع مقالات Lattice بعملية مراجعة شاملة ومزدوجة التعمية. تحتفظ المجلة بقائمة من المراجعين والمحررين الذين ينتمون جميعًا إلى جامعات أو منظمات بارزة ويساهمون في عمل المجلة.