الأخبار التكنولوجية والاستعراضات والنصائح!

لا يوجد حل لتعلم الآلة

ستساعدك المقالة التالية: لا يوجد حل لتعلم الآلة

محرك التوصية هو فئة من خوارزمية التعلم الآلي التي تقترح المنتجات والخدمات والمعلومات للمستخدمين بناءً على تحليل البيانات. تعد أنظمة التوصيات القوية هي العامل الرئيسي الذي يميز عمليات الشركات الكبرى مثل Netflix ، Amazon، و Byte Dance (أحد الوالدين في TikTok) وما إلى ذلك.

ألقى ألوك مينث ، عالم البيانات في إريكسون ، حديثًا إعلاميًا حول بناء “محركات توصية مخصصة لمشاكل العالم الحقيقي” في قمة مطوري التعلم الآلي (MLDS) 2021. “عندما تظهر مشكلة عمل متخصصة ، فإنها تتشابك مع طرق عمل. قد تكون تقنيات ML المعيارية غير كافية وقد لا تخدم غرض العميل. هذا هو المكان الذي تأتي فيه الحاجة إلى محرك مصنوع خصيصًا. لقد واجهنا أيضًا مثل هذه المشكلة مع وحدة شبكة الخدمة الخاصة بنا في إريكسون.

قال مينث إن الوحدة أرادت تنفيذ نظام توصية لتقديم اقتراحات لسير عمل التعيين – نموذج لتفويض المشاريع القادمة إلى الفريق الأنسب أو “تجمع الموارد”

التحدي

الائتمان: ألوك مينثي

كانت هناك ثلاثة أنواع من البيانات المتاحة:

بيانات تعريف التجمع: يتعلق بتكوين تجمع موارد معين – عدد الأشخاص وكفاءتهم والبيانات الوصفية الأخرى.

بيانات الطلب التاريخية: يساعد هذا النوع من البيانات في إنشاء علاقة بين طلب الميزة وتجمع موارد معين.

بيانات المعاملات: يستخدم للأغراض التشغيلية.

قال مينث إن بناء نظام توصية مخصص في هذا السياق يتضمن الخطوات التالية:

  • استخدام خوارزميات التجميع لإنشاء مجموعات من تجمعات الموارد بناءً على الميزات الوصفية المماثلة
  • إعادة تسمية اسم التجمع في بيانات طلب المشروع التاريخية باستخدام تسمية مجموعة التجمع المقابلة
  • استخدام خوارزمية التصنيف لتصنيف طلب المشروع إلى أحد تجمعات الكتلة
  • بناءً على توفر الموارد في الوقت الفعلي ودرجة التأهيل ، قم بترتيب مجموعة مخرجات المصنف
  • يوصي بالمجموعة الأكثر ملاءمة لمدير الموارد لتعيين المهمة / المشروع

خط أنابيب التدريب

لا يوجد حل لتعلم الآلة 1

الائتمان: ألوك مينثي

“بعد بناء نموذجنا ، كان الجزء الأصعب هو هندسة الميزات ، وهو أمر ضروري لبناء نظام فعال. من بين الوحدتين الرئيسيتين – التصنيف والتجميع – واجهنا تحديات فيما يتعلق بالأخيرة. كان لدينا معلومات قاطعة فقط مما يجعل من الصعب العثور على مسافات داخل الأشياء. لقد خرجنا من الصندوق لمعرفة ما إذا كان بإمكاننا إجراء أي تشفير خاص للبيانات. لقد اعتمدنا تقنيات تشفير البيانات والتشفير القائم على التردد في هذا الصدد ، “قال مينثي.

وحدة التجميع: بالنسبة لهذه الوحدة ، قام الفريق في البداية بتنفيذ أوضاع K والتكتل. ومع ذلك ، كانت النتائج بعيدة عن الكمال ، مما دفع الفريق إلى التفكير في خوارزمية K-mean القديمة. لأغراض التقييم ، تم إجراؤه يدويًا بمساعدة خبراء متخصصين.

احتوى النموذج النهائي على 700 مجموعة موارد مكثفة إلى 15 مجموعة تجمعات.

وحدة التصنيف: لهذه الوحدة ، تم استخدام ثلاثة أنواع من تكرارات الخوارزمية – Random Forest ، و Artificial Neural Network ، و XGBoost. تم استخدام دقة التصنيف كمقياس تقييم. أخيرًا ، بناءً على 50،00،000 سجل تدريب ، أظهرت هذه الوحدة دقة بنسبة 71 بالمائة.

النتائج والوجبات الجاهزة

قال مينث إن نموذج التوصية هذا يتم مراقبته كل أسبوعين من خلال التحقق من التجمعات المقترحة مقابل التجمعات المخصصة لمتطلبات المشروع:

أثبت النموذج نجاحه على ثلاث جبهات:

  • نسبة الإنجاز: هي عدد الطلبات التي تم تلبيتها مقابل إجمالي الطلبات الواردة إلى النظام. نحن نهدف إلى زيادة هذه النسبة على أساس أسبوعي.
  • الوقت الذي يستغرقه الطلب للدخول إلى النظام والخروج بتوجيه ناجح. الوقت المستغرق حاليًا هو 2-3 أيام ، والهدف هو تقليله إلى يوم واحد.
  • التوجيه الصحيح لأول مرة: يحدد الحالات التي يكون فيها الطلب الموجه إلى مجموعة معينة صحيحًا في المحاولة الأولى نفسها.

لخص مينث النقاط الرئيسية الثلاث من هذا المشروع في ملاحظاته الختامية: الحاجة إلى الحفاظ على الفروق الدقيقة للأعمال في حلول ML. التفكير فيما وراء مناهج تعلم الآلة القياسية ؛ وإدراك أنه لا يوجد حل “رصاصة فضية” ML.