الأخبار التكنولوجية والاستعراضات والنصائح!

تعرف على أبطال MachineHack الذين اخترقوا هاكاثون “توقع مبيعات ألعاب الفيديو”

ستساعدك المقالة التالية: تعرف على أبطال MachineHack الذين اخترقوا هاكاثون “توقع مبيعات ألعاب الفيديو”

اختتمت MachineHack بنجاح الجزء العاشر من سلسلة هاكاثون نهاية الأسبوع يوم الاثنين الماضي. حظي هاكاثون توقع مبيعات ألعاب الفيديو بترحيب كبير من قبل المتحمسين لعلوم البيانات مع أكثر من 350 تسجيلًا ومشاركة نشطة من ما يقرب من 200 ممارس.

من بين 230 منافسًا ، تصدرت ثلاثة منهم لوحة المتصدرين. في هذه المقالة ، سوف نقدم لك الفائزين وسنصف النهج الذي اتبعوه لحل المشكلة.

رقم 1 | جي موثي

جي موثي هو طالب في السنة الأخيرة في هندسة الكمبيوتر في معهد الجيش للتكنولوجيا ، بيون. بدأت رحلته في علم البيانات مع فترة تدريبه في IIT Madras تحت إشراف أساتذة IIT.

منذ ذلك الحين ، لم ينظر إلى الوراء أبدًا وكان يستكشف مجالات مختلفة في علم البيانات بمساعدة رؤسائه الكبار ويستخدم منصات مثل Kaggle والأنظمة الأساسية الأخرى التي تستضيف الهاكاثون. يحب استكشاف أنواع مختلفة من الهاكاثون للتجربة واكتساب مهارات جديدة.

نهج لحل المشكلة

يشرح موثي نهجه باختصار على النحو التالي:

عند استكشاف البيانات ، كانت معظم الميزات ذات طبيعة قاطعة. بدأت بتجربة تقنيات تشفير مختلفة وتطبيق catboost مع المعلمات الافتراضية.

1. تقنيات التشفير لم تحسن النموذج كما هو متوقع

2. لم يكن النموذج الفردي وتقنيات التشفير الفردي كافيين لالتقاط رؤى البيانات

3. نظرًا لأن Catboost يمكنه التعامل مع الميزات الفئوية داخليًا دون الحاجة إلى تشفير خارجيًا ، فقد تم اختيار هذا ليكون النموذج الأول

4. مع ترميز الملصقات ، تم تدريب طرازي LGB و XGB باستخدام Stratified K Fold تقنية 10 ، 20 طية على التوالي

5. تم استخدام مجموعات النماذج الثلاثة المذكورة أعلاه كنموذج نهائي

“المسابقات التي تنظمها MachineHack مفيدة للمبتدئين لمحاولة تعلم المفاهيم في بيئة تنافسية. كانت التجربة بشكل عام مليئة بالتعلم ، وأود أن أستكشف المزيد من هذه التحديات في المستقبل وأن أشارك فيها “. – شارك تجربته.

احصل على الكود الكامل هنا.

# 2 | كانيكا ميجلاني

صادفت كانيكا النمذجة الرياضية لأول مرة خلال برنامج تخرجها في جامعة دلهي. ولكن حدثت مقدمة مناسبة لعلوم البيانات في IIT Tirupati حيث تم تسجيلها حاليًا في درجة الماجستير في الإحصاء والرياضيات. نظرًا لهيكل الدورة التدريبية شبه المثالي والحرص على تعلم كيفية اتخاذ قرارات أفضل باستخدام البيانات ، فقد طورت اهتمامًا شديدًا بالتعلم الآلي وعلوم البيانات.

قال كانيكا: “لقد استمتعت للتو بحل المشكلات باستخدام الأساليب التحليلية وأردت دمج التكنولوجيا في عملي”.

بدأت في الاستفادة من الوقت الإضافي الذي حصلت عليه أثناء الوباء وقامت بمجموعة من الدورات التدريبية عبر الإنترنت حول Python والتعلم الآلي.

دفعها فضولها للتعلم والدعم من أصدقائها إلى العمل على مجموعة متنوعة من المشاكل.

قال كانيكا: “لقد كان الأمر مثيرًا حقًا بالنسبة لي ، وأنا أفهم أن هذه مجرد البداية ، لذلك ما زلت في طريقي لاستكشاف المجال والعمل على نفسي لأتحسن فيه”.

نهج لحل المشكلة

تشرح كانيكا نهجها باختصار على النحو التالي:

لوصف كيف توصلت إلى استنتاجاتي في هذا المشروع باستخدام البيانات ، بدأت من المعالجة المسبقة للبيانات. تضمنت تقنيات تنظيف البيانات الخاصة بي تحديد ما إذا كانت البيانات التي حصلت عليها منطقية وتصحيح أي قيم غير منطقية بعد أن يكون لدي معلومات كافية.

لقد جمعت بين مجموعات التدريب والاختبار للتأكد من أن النموذج يحصل على عرض مناسب للميزات. لقد استخدمت ترميز الملصقات لمعرفات المنتجات وترميز واحد ساخن للمتغيرات الفئوية الأخرى. تعامل مع نقاط المستخدم والنقد باستخدام بعض التحويلات متعددة الحدود وأسقط المعلومات غير ذات الصلة.

قمت بدمج بعض الفئات التي كان لها تردد أقل في أقرب جيرانها وقمت بتحويل تنسيق السنة المتغيرة إلى عدد السنوات اعتبارًا من اليوم.

بعد تجربة جميع تقنيات النمذجة والتعلم الآلي مثل PyCaret ، انتقلت مع أفضل الخيارات المتاحة وفقًا لمقياس التقييم الذي تم استخدامه في لوحة المتصدرين ، RMSE في هذه الحالة.

بدأت بتجربة تقنيات التجميع مثل تكديس النماذج ومزجها. في هذه المشكلة ، حصلت على أفضل درجاتي من خلال Voting Regressor مع أوزان متنوعة لنماذج مختلفة ، مع تعزيز الخوارزميات بشكل أساسي.

ثم واصلت تقييم الأداء بناءً على RMSE وفحصت ما إذا كان بإمكاني تحسين نموذجي أكثر من ذلك.

“جئت للتعرف على MachineHack من صديق. كان هذا أول هاكاثون لي على هذه المنصة ، وقد تعرفت عليه عندما كان موجودًا بالفعل. لقد أحببت حقًا العمل على MachineHack باعتبارها بوابة التقديم وساعدت لوحة الصدارة في تتبع أدائي بسلاسة ، وقد جعلني العدد المحدود من عمليات الإرسال أحلل بدقة كل نموذج قبل إرسال أي حل. لقد جعل هذا الهاكاثون أكثر تنافسية ودفعني إلى التأكد من حلولي وليس مجرد تجربة أي شيء دون استخدام عقلي.

إنه يوفر للأشخاص منصة للتعلم والأداء والتفوق في مجال علم البيانات ، وهذا أمر رائع. أنا متحمس حقًا للأحداث القادمة على MachineHack وأتطلع إلى الاستفادة من هذه المنصة لتحسين مهاراتي والتواصل مع الأشخاص ذوي التفكير المماثل! ” – شاركت تجربتها في MachineHack.

احصل على الكود الكامل هنا.

# 3 | كاليب إميليكي

كاليب خريج علوم الكمبيوتر وقد بدأ مؤخرًا حياته المهنية في علوم البيانات. تم تقديمه إلى مجال علم البيانات من قبل معلمه ، الذي قدم له التوجيه المستمر في اختيار الدورات المناسبة عبر الإنترنت. لقد أجرى العديد من الدورات التدريبية عبر الإنترنت في علم البيانات. إلى جانب ذلك ، أثناء قيامه بدورات عبر الإنترنت ، طبق معرفته في حل المشكلات ومن خلال المشاركة في الهاكاثون.

“حتى الآن لم أندم أبدًا على اختيار علم البيانات كمهنة.” – هو قال.

نهج لحل المشكلة

يشرح كالب نهجه باختصار على النحو التالي:

أولاً ، حاولت فهم البيانات من خلال القيام ببعض الاستكشافات الأساسية ، ثم عرفت بعض الميزات التي ستساعدني أيضًا. كانت الميزة الرئيسية الهندسية التي قمت بها والتي أعطتني دفعة هي ميزات groupby. جمعت بعض الميزات مع الآخرين ، ووجدت عدد التفرد ، والتهم ، والمتوسط ​​، والانحراف المعياري. ثم في النمذجة ، استخدمت خوارزمية catboost و lightgbm و xgboost للنمذجة. أخيرًا ، قمت بعمل متوسط ​​مرجح باستخدام catboost و xgboost الذي أعطاني أفضل درجاتي.

“MachineHack هي منصة جيدة حقًا يجب على كل عالم بيانات أن يجربها على الأقل. على المرء أن يبذل المزيد من العمل قبل أن يحصل على تحسن “. – تحدث عن تجربته في MachineHack.

احصل على الكود الكامل هنا.

تحقق من هاكاثون جديدة هنا.