الأخبار التكنولوجية والاستعراضات والنصائح!

الفوز بأكبر تحدي تنبؤ بالعملات المشفرة: منهج الفائزين

ستساعدك المقالة التالية: الفوز بأكبر تحدي تنبؤ بالعملات المشفرة: منهج الفائزين

أكملت Rocket Capital Investment (RCI) ، بالتعاون مع MachineHack ، بنجاح أطول بطولة blockchain في 5 سبتمبر 2022. وكان الهدف هو تحفيز أفضل تطبيقات التعلم الآلي للتمويل.

يقع مقرها الرئيسي في سنغافورة ، وتجمع المؤسسة المالية المرخصة RCI بين خبرتها المالية وتوقعات التعلم الآلي الخارجية من خلال بطولة blockchain في الأسواق المالية. من خلال هذه المسابقة ، تهدف RCI إلى استخدام منصة لامركزية لتوليد وتحفيز أفضل تطبيقات التعلم الآلي لصناعة التمويل.

من بين العديد من الإدخالات التي تم تلقيها ، فقط أفضل اللوط وصل إلى القمة. تحدثت مجلة Analytics India Magazine إلى بعض من أفضل الفنانين أداءً لفهم رحلة علوم البيانات الخاصة بهم ، ونهج الفوز ، والخبرة الشاملة في MachineHack.

دعونا نلقي نظرة على الأشخاص الذين أثاروا إعجاب الحكام بمهاراتهم في البيانات.

مانيش باتاك – عالم بيانات أول

باثاك هو أحد خريجي BITS بيلاني الذي بدأ استكشاف علم البيانات في سنته السابقة على النهائي. مع كل الرياضيات المعقدة التي تعلمها خلال الكلية والخبرة في التعامل مع البيانات على نطاق واسع باستخدام البيانات الضخمة ، كان يميل بشكل طبيعي للمساهمة في مجتمع علوم البيانات.

نهج الفوز

كل أسبوع ، كانت مجموعة بيانات التدريب عبارة عن بيانات منظمة رقمية تحتوي على أكثر من 2000 ميزة وحوالي 1 lakh ملاحظات. كان الهدف مستمرا. طوال فترة المنافسة ، قام Pathak بتدريب الانحدار المختلفين على مجموعة البيانات مع ارتباط Spearman كمقياس. كانت الانحدارات التي قام بتدريبها هي بشكل أساسي عوامل الانحدار المعززة القائمة على الأشجار مثل XGBoost و CatBoost و LightGBM. كما قام بتدريب Random Forest والشبكات العصبية في تحديات أسابيع قليلة.

نظرًا لأن مجموعة البيانات كانت ضخمة ، كان LightGBM و XGBoost أسرع نسبيًا من CatBoost. قام بضبط المعلمات الفائقة باستخدام طرق التحسين Bayesian دون أي k-Fold السيرة الذاتية كوقت كان قيد.

نظرًا لأن مجموعة البيانات كانت تستند إلى الوقت ، فقد استخدم أحدث البيانات (حوالي 10٪) كمجموعة تحقق من الصحة. بعد ذلك ، استخدم باتاك متوسطًا مرجحًا للتنبؤات من مختلف الانحدار لتحسين ارتباط سبيرمان والتحقق من ترتيب التنبؤات عن طريق الفرز.

سوراب ساوهني – مستشارة علوم بيانات

لقد أذهل علم البيانات ساوني حتى قبل أن يسمع المصطلح. بعد سنوات عديدة من الممارسة كجراح عيون ، قرر استخدام لوحة المفاتيح. مجال اهتمامه الحالي هو تطبيقات الرؤية الحاسوبية. بصرف النظر عن تجربة يده في مختلف الهاكاثونات ، يقوم بتوجيه طلاب الذكاء الاصطناعي / تعلم الآلة في عطلات نهاية الأسبوع.

نهج الفوز

بدأ Sawhney بتقييم أهمية الميزة واختبار نماذج مختلفة باستخدام أعداد مختلفة من الميزات. وجد أن استخدام أفضل ميزات 160-200 كان مناسبًا لالتقاط المعلومات الواردة.

قام بتقييم نماذج مختلفة قبل أن يقرر أخيرًا مجموعة Random Forest و XGBoost. نظرًا لأن المتغير المستهدف متسلسل بشكل أساسي ، فقد جرب أيضًا نماذج متسلسلة زمنية مختلفة ، لكن نتائج تلك التجارب لم تكن مرضية.

لحساب بعض التأثير على موقف الأسبوع السابق للعملة ، قام بحساب هذه القيمة لجميع العملات المعدنية حيثما أمكن ذلك. ثم قام بدمجه مع تنبؤ المجموعة ، باستخدام المتوسط ​​المرجح لتخصيص 4٪ وزن لآخر قيمة عملة و 96٪ وزن لتنبؤ المجموعة.

أندريه بيسالوف – عالم بيانات

بعد الانتهاء من دراسته في الرياضيات قبل عقد من الزمن ، بدأ بيسالوف العمل كعالم بيانات. شارك في هاكاثون ML على المنصات لمدة عامين وتعلم الكثير من هذه المسابقات. أكثر مسابقاته التي لا تُنسى هي: Renew Power و Dare in Reality Hackathon 2021 و Rocket Capital Crypto Forecasting.

نهج الفوز

1) إعداد مجموعات البيانات:

● استغرق بيسالوف الأشهر الثلاثة الماضية لمجموعة التقييم ؛

● بالنسبة لمجموعة التدريب ، أخذ جميع الفترات الأخرى مع وجود فجوة (توقف) لمدة شهر واحد لمجموعة التحقق من الصحة. على سبيل المثال ، يمكن للمرء أن يختار: 2022-06-01 إلى 2022-09-01 لمجموعة التحقق من الصحة ، أول شهر متاح حتى 2022-05-01 لمجموعة التدريب وما إلى ذلك.

2) الميزات:

عندما درب بيسالوف النموذج النهائي ، استخدم جميع الميزات العددية – 2010 إجمالاً.

3) النموذج:

قام بتدريب نموذج Xgboost مع التوقف المبكر على مجموعة التحقق والمعلمات التالية:

‘الهدف’: ‘reg: squarederror’،

“إيتا”: 0.05 ،

“max_depth”: 6 ، # -1 تعني عدم وجود حد

“العينة الفرعية”: 0.7 ، # نسبة العينة الفرعية لمثيل التدريب.

‘colsample_bytree’: 0.7 ، # نسبة العينة الفرعية للأعمدة عند إنشاء كل شجرة.

‘reg_alpha’: 0 ، مصطلح تسوية # L1 على الأوزان

‘reg_lambda’: 0 ، مصطلح تسوية # L2 على الأوزان

تم اختبار الأساليب:

● قام بتثبيت مجموعة التحقق وحاول العثور على مجموعة التدريب (عدد الأشهر لمجموعة التحقق من الصحة) التي تعطي أفضل درجة ارتباط سبيرمان.

● استكشف الميزات من خلال حساب مؤشر الاستقرار ثم حاول إزالة الميزات غير المستقرة (بمعايير مختلفة) من النموذج.

● حاول تدريب نماذج مختلفة ثم قام بتكديسها خطيًا (أخذ كل التركيبات الخطية الممكنة بخطوة 0.01):

○ Xgboost

○ غابة عشوائية

○ النماذج الخطية

الحلول الجاهزة ، عرض درجة عالية من المهارات.

شهد تحدي CryptoPrediction أن المشاركين يجلبون حلولًا خارج الصندوق إلى الطاولة لحل المشكلة المبتكرة التي تم تقديمها لهم. إن امتلاك مثل هذا المستوى العالي من المهارات في تحدي CryptoPrediction جعله بالتأكيد نجاحًا كبيرًا.