الأخبار التكنولوجية والاستعراضات والنصائح!

تعرَّف على علماء البيانات الذين حلَّقوا “اكتشاف العيوب في تصنيع الويفر: هاكاثون عطلة نهاية الأسبوع رقم 18”

ستساعدك المقالة التالية: تعرَّف على علماء البيانات الذين حلَّقوا “اكتشاف العيوب في تصنيع الويفر: هاكاثون عطلة نهاية الأسبوع رقم 18”

أجرى MachineHack بنجاح الفصل الثامن عشر من سلسلة hackathon نهاية الأسبوع هذا الإثنين. اكتشاف الشذوذ في تصنيع الويفر: أتاح هاكاثون نهاية الأسبوع رقم 18 للمتسابقين فرصة لإعادة النظر في مهارات التصنيف من خلال تصنيف فئات مختلفة من المنتجات إلى 2 فصول مختلفة. تم الترحيب بالهاكاثون بشكل كبير من قبل المتحمسين لعلوم البيانات مع أكثر من 280 تسجيل ومشاركة نشطة من ما يقرب من 180 ممارسًا.

من بين 280 منافسًا ، تصدرت ثلاثة منهم لوحة المتصدرين. في هذه المقالة ، سوف نقدم لك الفائزين وسنصف النهج الذي اتبعوه لحل المشكلة.

لبناء النموذج في هذا الهاكاثون ، استخدم نموذج LGBM حساسًا للتكلفة للتدريب في البداية ثم انتقل إلى حزمة AutoGluon مع تحسين Stacking and Hyperparameter. بدأت رحلته مع علم البيانات في عام 2015 عندما انضم إلى معهد IIIT بنغالور. بدأ في IIIT التعلم واستكشاف ML ، الذي انضم إليه بعد ذلك Amazon كما SDE وكان قد استراحة من ML. في العام الماضي ، بدأ مرة أخرى مع ML ، عندما انضم إلى فريق ML في Amazon وبدأت العمل في مشاريع ML التي لها تأثير مباشر على الأشخاص من حولنا والمشترين والبائعين عليها Amazon.

يود أن يشكر Machine Hack لمنحه فرصة لإبقاء نفسه على اطلاع دائم بالاتجاه.

هذا هو أول هاكاثون لي على MachineHack. كانت التجربة بشكل عام جيدة ، وآمل أن نرى في المستقبل الهاكاثون يحل مشكلات الحياة الواقعية. قليلا بخيبة أمل مع التوقف عن الأشياء الجيدة: P “- شارك مانوج رأيه حول MachineHack

لإنشاء نموذج قوي للكشف عن الشذوذ ، قام Nepture بتجميع 3 نماذج مختلفة لإنشاء نموذج نهائي باستخدام حزمة AutoGluon.

فيما يلي بعض الأفكار السريعة:

  • النموذج 1 – تدريب AutoGluon مع التراص التلقائي ، و 5 طيات ، و 5 طيات للتعبئة
  • النموذج 2 – تجاوز مخرجات النموذج 1 بنقاط بيانات التدريب المتداخلة
  • النموذج 3 – AutoGluon مع ضبط hyperparameter + مخرجات الكشف الخارجة كميزات
  • النموذج النهائي – متوسط ​​النواتج من النماذج 1 و 2 و 3

لطالما كان متحمسًا للرياضيات والحوسبة الرقمية التي قادته بطبيعة الحال إلى مهنة في علم البيانات. لقد كان في هذا المجال لأكثر من 10 سنوات حتى الآن وعمل على مجموعة متنوعة من مشاكل ML عبر الصناعات. ومع ذلك ، فقد الاتصال مع النمذجة العملية بمرور الوقت. لكنه الآن يحاول التخلص من مهاراته في البرمجة واللعب بوصفات ML خلال عطلات نهاية الأسبوع ، وهو أمر ممتع للغاية!

لقد قدمت Machine Hack منصة مثالية بالنسبة لي لممارسة تعلم الآلة مع عبارات مشكلة مثيرة للاهتمام بحجم البايت ويمكن معالجتها في فترة زمنية قصيرة. أيضًا ، يعد الإعداد التنافسي هو الأنسب لضبط خطوط الأنابيب التي من شأنها توفير نماذج قوية وعالية الأداء. نقدر AIM لهذه الخدمة الرائعة للمتعلمين في مجتمع ML“- شارك نبتون رأيه.

يشرح ناصر نهج الحل الخاص به على النحو التالي.

  1. القضاء على الميزات بمجموع صغير منها.
  2. تم تطبيق المصنفات المعززة للتدرج ولكن لم يمنح أي منها درجة +90
  3. تطبيق الانحدار اللوجستي الذي أعطى نتائج أفضل (+91 درجة)
  4. تصنيف الميزة مع حذف الميزة العودية (RFECV) ولكن النتيجة لم تتحسن.
  5. جربت Tabnet وحصلت على أفضل نتيجة عامة +93. (كان المفتاح يستخدم AdamW + 15 StratifiedKfold)

بدأت رحلته في علم البيانات منذ 5 أشهر. في ذلك الوقت ، لم يكن لديه أدنى فكرة عن ماهية إطار البيانات ، لذلك بدأ الحفر في هذا المجال الرائع ، دورة تدريبية في اليوم ، وتعلم كل شيء صادفه. بدءًا من الإحصائيات والتعلم الآلي والانتقال إلى التعلم العميق وتعلم كيفية استخدام أطر عمل مختلفة. لأول مرة في حياته بأكملها ، يشعر وكأنه يفعل شيئًا يحبه ولا يمكنه الحصول على ما يكفي من القيام بذلك. بعد الحصول على صورة أكبر لماهية علم البيانات ، انتقل للمشاركة في مسابقات مختلفة في منصات مختلفة لتطبيق ما تعلمه ، في مشاكل الحياة الواقعية.

MachineHack هو واحد منهم. لقد قابلت عقول عظيمة وأشخاص ماهرين ساعدوني بطرق مختلفة. لقد تعلمت الكثير من كل واحد منهم. لولا مساعدتكم لما كان هذا ممكنا.! لا يزال لدي الكثير لأتعلمه ، والكثير من المسابقات للمشاركة فيها ، وطريق طويل لنقطعه ، لكن “الأمر كله يتعلق بالرحلة ، وليس الوجهة”. “- ناصر رأيه.