الأخبار التكنولوجية والاستعراضات والنصائح!

تنبيه الهاكاثون! أطلقت MachineHack “بطولة هندسة البيانات” كجزء من قمة DES2022

ستساعدك المقالة التالية: تنبيه الهاكاثون! أطلقت MachineHack “بطولة هندسة البيانات” كجزء من قمة DES2022

تُعد قمة هندسة البيانات 2022 ، التي قدمتها Google Cloud ونظمتها مجلة Analytics India ، أول مؤتمر في الهند مخصص لمجال هندسة البيانات عالي الطلب والمؤثر. سيركز هذا المؤتمر الافتراضي ، الذي سيعقد في 30 أبريل 2022 ، على ابتكار هندسة البيانات ويمنح الحضور إمكانية الوصول المباشر إلى كبار المهندسين والمبتكرين العاملين في شركات التكنولوجيا الرائدة.

ستكون هذه فرصة ذهبية للحضور للتعرف على بنية نشر البرامج لأنظمة التعلم الآلي ، وكيفية إنتاج أحدث أطر عمل البيانات والحلول لحالات استخدام الأعمال من الأفضل في هذا المجال.

بطولة هندسة البيانات بواسطة MachineHack

ينظم MachineHack هاكاثون هندسة البيانات لعلماء البيانات ومهندسي البيانات للمشاركة والفوز بفرصة للتقديم في DES 2022.

تتكون هندسة البيانات من جمع بيانات عالية الجودة وتوفيرها والحفاظ عليها للحصول على رؤى. من أجل القيام بذلك ، يحتاج مهندس البيانات إلى تصميم بنية بيانات قابلة للتطوير وتطويرها ، وإعداد العمليات التي تجمع البيانات من مصادر متعددة ، والتحقق من جودة البيانات ، والقضاء على البيانات الفاسدة. بالإضافة إلى ذلك ، يلزم تحليل البيانات الاستكشافية (EDA) وتقنيات الاستخراج والتحويل والتحميل (ETL) للوصول إلى المصب واستخدامه لحل مشاكل الأعمال.

تاريخ البدء: 13 أبريل 2022 ، 6:00 مساءً

تاريخ الانتهاء: 30 مايو 2022 ، 6:00 مساءً

كل ما تريد معرفته عن “بطولة هندسة البيانات”

مع مجموعة البيانات المقدمة ، يحتاج المشاركون إلى تحليل وإنشاء ميزات الوصف التالي.

  • “DATE”: أنشئ التاريخ من السنة والشهر واليوم من الأسبوع
  • “LOW”: قيمة أقل لـ DEP_TIME_BLK
  • “HIGH”: قيمة أعلى لـ DEP_TIME_BLK
  • “TIMESTAMP”: أنشئ طابعًا زمنيًا بالتاريخ وقيمة أقل DEP_TIME_BLK
  • “WIND_CHILL”: درجة الحرارة المتصورة نتيجة لتأثير التبريد الناتج عن هبوب الرياح
  • “PRCP_SNOW_RATIO”: نسبة هطول الأمطار والثلوج
  • “PLANE_AGE_AIRLINE_AIRPORT_FLIGHTS_MONTH_RATIO”: نسبة عمر الطائرة وعدد أشهر رحلات الطيران والمطار.
  • “SEAT_DISTRIBUTION”: نسبة المقاعد وفي الرحلة المتزامنة CONCURRENT_FLIGHTS
  • ‘SEAT_DISTRIBUTION_NORMALISED’: القيم المعيارية لنسبة المقاعد وفي الرحلة المتزامنة

تقييم

لحساب الفائزين في الهاكاثون ، سيتم تقييم المشاركات باستخدام متوسط ​​الخطأ المطلق. يمكن للمرء استخدام sklearn.metrics.mean خطأ مطلق لحساب نفس mean_squared_error (y_true، y_pred، squared = False).

سوف يدعم هذا الهاكاثون لوحات المتصدرين الخاصة والعامة.

  • يتم تقييم لوحة الصدارة العامة على 30٪ من مجموعة البيانات
  • سيتم توفير لوحة المتصدرين الخاصة في نهاية الهاكاثون ، والتي سيتم تقييمها على أساس 100٪ من مجموعة البيانات
  • تمثل النتيجة النهائية النتيجة التي تم تحقيقها بناءً على أفضل نتيجة على لوحة المتصدرين العامة

كيف يتم إنشاء ملف تقديم صالح؟

لإرسال ملفك ، يجب مراعاة الخطوات التالية.

  • يجب أن تدعم نماذج Sklearn تنسيق يتنبأ() طريقة لتوليد القيم المتوقعة.
  • يجب على المشارك إرسال ملف .csv بامتداد 2،00،00 صف مع 9 أعمدة. التقديم سيعود بامتداد نتيجة غير صحيحة إذا كان لديك صفوف أو أعمدة إضافية.
  • يجب أن يحتوي الملف على 9 بالضبط الأعمدة.

النقاط التي يجب ملاحظتها:

  • لا ينبغي للمرء أن يخلط تسلسل سلسلة الاختبار
  • إذا كنت تستخدم الباندا ، فاستخدم رمز الإرسال التالي:

Submit_df.to_csv (‘my_submission_file.csv’ ، الفهرس = خطأ

مجموعة البيانات: 200000 صف × 26 عمود

  • الشهر: الشهر
  • DAY_OF_WEEK: يوم من الأسبوع
  • DEP_DEL15: TARGET ثنائي لتأخير المغادرة لأكثر من 15 دقيقة (1 نعم)
  • DISTANCE_GROUP: مجموعة المسافة التي يتعين قطعها بالطائرة المغادرة
  • DEP_BLOCK: منع المغادرة
  • SEGMENT_NUMBER: الجزء الذي يوجد به رقم الذيل هذا لليوم
  • CONCURRENT_FLIGHTS: الرحلات المتزامنة المغادرة من المطار في نفس كتلة المغادرة
  • NUMBER_OF_SEATS: عدد المقاعد على متن الطائرة
  • CARRIER_NAME: شركة الجوال
  • AIRPORT_FLIGHTS_MONTH: متوسط ​​رحلات المطار في الشهر
  • AIRLINE_FLIGHTS_MONTH: متوسط ​​رحلات شركة الطيران شهريًا
  • AIRLINE_AIRPORT_FLIGHTS_MONTH: متوسط ​​الرحلات الجوية شهريًا لشركة الخطوط الجوية والمطار
  • AVG_MONTHLY_PASS_AIRPORT: متوسط ​​عدد الركاب للمطار المغادرة للشهر
  • AVG_MONTHLY_PASS_AIRLINE: متوسط ​​عدد ركاب شركة الطيران للشهر
  • FLT_ATTENDANTS_PER_PASS: المضيفات لكل راكب لشركة الطيران
  • GROUND_SERV_PER_PASS: موظفو الخدمة الأرضية (مكتب الخدمة) لكل راكب لشركة الطيران
  • PLANE_AGE: عمر الطائرة المغادرة
  • DEPARTING_AIRPORT: مطار المغادرة
  • LATITUDE: خط عرض المطار المغادرة
  • LONGITUDE: خط طول مطار المغادرة
  • PREVIOUS_AIRPORT: المطار السابق الذي غادرت منه الطائرة
  • PRCP: بوصة من هطول الأمطار لهذا اليوم
  • ثلج: بوصة من تساقط الثلوج لهذا اليوم
  • SNWD: بوصة من الثلج على الأرض لهذا اليوم
  • TMAX: أقصى درجة حرارة لهذا اليوم
  • AWND: سرعة الرياح القصوى لهذا اليوم

تاريخ البدء: 13 أبريل 2022 ، 6:00 مساءً

تاريخ الانتهاء: 30 مايو 2022 ، 6:00 مساءً

جائزة

سيحصل الفائزون الثلاثة على فرصة لتقديم أساليب الحلول الخاصة بهم في قمة هندسة البيانات (DES 2022).

آخر موعد للتقديم

إذا كنت تريد أن تكون جزءًا من هذا الهاكاثون المثير ، فتأكد من إرسال مشاركاتك بحلول 30 مايو 2022 ، الساعة 06:00 مساءً بتوقيت الهند القياسي، حيث سيتم تجميد لوحة الصدارة الخاصة في ذلك الوقت.

تنحية

  • إذا تم العثور على أي من التفاصيل التي تم إدخالها غير صحيحة ، تحتفظ مجلة Analytics India Magazine بالحق في استبعاد أي مشارك.
  • أي استخدام خارجي لمجموعة البيانات ممنوع منعا باتا. سيتم استبعاد المشاركين إذا تم العثور عليهم باستخدام أي مجموعة بيانات خارجية.