ستساعدك المقالة التالية: تحقيق التوازن الصحيح – نحو الذكاء الاصطناعي
نُشر في الأصل على نحو AI ، الشركة الرائدة في العالم في مجال الذكاء الاصطناعي والأخبار التقنية والإعلام. إذا كنت تقوم ببناء منتج أو خدمة متعلقة بالذكاء الاصطناعي ، فنحن ندعوك للتفكير في أن تصبح راعيًا للذكاء الاصطناعي. في نحو الذكاء الاصطناعي ، نساعد في توسيع نطاق الشركات الناشئة في مجال الذكاء الاصطناعي والتكنولوجيا. دعنا نساعدك على إطلاق التكنولوجيا الخاصة بك للجماهير.
ML أم لا ML؟
في عصر أصبح فيه الذكاء الاصطناعي والتعلم الآلي مثل الطبيعة الثانية للمؤسسة ، من الضروري أحيانًا التراجع والتأمل في مدى صلة التعلم الآلي بحالة الاستخدام الخاصة بك. غالبًا ما يكون علماء وقادة البيانات على مفترق طرق لإنشاء ونشر نموذج التعلم الآلي أو الالتزام بتحليلات البيانات البسيطة.
ستكون هذه المدونة بمثابة دليل شامل لاتخاذ هذا القرار الصعب والحاسم. تنقسم المدونة إلى جزأين: سيوفر الجزء الأول بعض العناصر التي يمكن تقييمها لمعرفة ما إذا كان لديك التفاصيل اللازمة للاستفادة من خوارزميات التعلم الآلي. سيوجه الجزء الثاني من المدونة كيفية الاختيار بين نموذج تعلم آلي بسيط أو معقد.
لنبدأ بالجزء الأول. اسأل نفسك الأسئلة أدناه لمعرفة ما إذا كان لديك المكونات الصحيحة لبناء نموذج التعلم الآلي.
1. توافر البيانات: لقد سمعنا جميعًا عن “إدخال القمامة ، وإخراج القمامة”. البيانات عنصر أساسي في تقرير نجاح نموذجك. لذلك ، من الضروري إجراء تحليل شامل للبيانات المتاحة لحالة الاستخدام ذات الصلة. يعد بناء النموذج عملية كثيفة البيانات ، خاصة إذا كان نموذجًا للتعلم العميق. من الأهمية بمكان تحليل جميع مصادر البيانات في مستودعات البيانات الخاصة بك للتحقق مما إذا كنت ستتمكن من إنشاء أي خطوط بيانات فعالة.
2. جودة البيانات: لا يقتصر الأمر على كمية البيانات فحسب ، بل تلعب الجودة دورًا مهمًا في تحديد ما إذا كان بإمكانك اختيار مسار الذكاء الاصطناعي. من الضروري للغاية إجراء فحوصات جودة البيانات للتشتت والقيم الفارغة والدقة وما إلى ذلك.
في حالة عدم وجود بيانات داخلية ، يمكنك دائمًا استكشاف خيار الوكيل أو البيانات الاصطناعية.
3. موارد: يتطلب مشروع بناء النموذج الناجح فريقًا قويًا من علماء البيانات ، ومهندسي ML / Data ، ومطوري البرامج ، والاستراتيجيين ، وما إلى ذلك. يعد توظيف الموارد المناسبة أمرًا مهمًا للغاية لضمان التنفيذ الناجح لمشروع ML / AI الخاص بك. بصرف النظر عن الموارد البشرية ، يجب عليك التحقق من ميزانية الأنظمة الأساسية وتقنيات السحابة التي ستكون مطلوبة للنشر الناجح لمشروعك.
4. التحديات التنظيمية: إذا كنت جزءًا من صناعة شديدة التنظيم ، فمن الضروري فهم التحديات التنظيمية التي قد تواجهها أو الموافقات التي تحتاجها لنشر نموذجك في الإنتاج. قد تطلب منك السلطات التنظيمية إنشاء نماذج قابلة للتفسير أو إجراء اختبار الإنصاف والتحيز على نموذجك. سيكون من الأفضل أن تضع في اعتبارك الوقت اللازم لتحقيق ذلك في عملية بناء النموذج الخاصة بك.
5. تعقيد المشكلة والنتائج القابلة للقياس: الأهم والأكثر تقويضًا هو المناقشة حول مدى تعقيد مشكلتي. هذا ليس شيئًا يجب أو يمكن تحديده في عزاء. قد ترغب في إجراء محادثة شاملة مع شركائك في العمل وأصحاب المصلحة حول تأثير الأعمال للمشكلة جنبًا إلى جنب مع المقياس الذي تحاول حله. يمكن أن يكون المقياس في أي مكان بين معدل الاحتفاظ بالمستخدمين أو زيادة نسبة النقر إلى الظهور.
في بعض الأحيان قد يكون أسلوبًا إحصائيًا بسيطًا يمكن أن يحل حالة الاستخدام المطروحة ، ولكن بمجرد أن تتزوج كل هذه العناصر ، ستتمكن من اتخاذ قرار مدروس ومحسوب. يمكن أن يكون نشر ML غير متوقع ، ولكن على الأقل ستعرف أنك قد بذلت العناية الواجبة قبل السير في طريق الذكاء الاصطناعي.
قد تكون أيضًا على مفترق طرق بشأن المضي قدمًا في ML أو النماذج الإحصائية. يهدف ML إلى إيجاد أنماط داخل البيانات لعمل تنبؤات ذات مغزى. في الوقت نفسه ، إذا كنت تريد فهم العلاقة بين هذه المتغيرات ومعرفة مدى أهمية هذه العلاقات ، فمن الأفضل التمسك بالنماذج الإحصائية. دعوة لحجز رحلة اليوم! تحتوي النماذج الإحصائية على عدد قليل من الافتراضات التي تم تسطيرها والتي قد لا تكون صحيحة في البيانات على المستوى الصناعي ، ولكن يمكن أن يختلف ذلك اعتمادًا على حالة الاستخدام الخاصة بك.
الآن دعنا ننتقل إلى الجزء الثاني من المدونة. لذلك قررنا السير في طريق ML. السؤال هو ما إذا كان يجب اختيار نموذج بسيط أو معقد. لا يوجد مقاس واحد يناسب الجميع ، لذلك لا يمكنني أن أدافع عن اختيار واحد على الآخر. لكن يمكنك اتخاذ قرار محسوب من خلال تحليل العناصر أدناه.
1. ابدأ بنموذج بسيط: من المفيد دائمًا البدء بنماذج الفانيليا. ستساعدك هذه الخطوة على تقييم أداء نموذجك وتعطيك رقمًا أساسيًا. يُفضل دائمًا تقديم مجموعة متنوعة من النماذج لأصحاب المصلحة لديك حتى يتمكنوا من الاختيار من بينها.
2. الدقة مقابل التفسير: غالبًا ما يتعامل علماء البيانات مع هذه المقايضة. غالبًا ما توفر النماذج المعقدة دقة أعلى ، ولكن هل يمكنك بناء نموذج قابل للتفسير حولها؟ من الأهمية بمكان أن تثق قيادتك العليا في نتائجك ، لذلك يجب عليك فتح الصندوق الأسود لها. من الضروري أيضًا أن يفهم علماء البيانات الدافع وراء القرار. ولكن إذا كانت الدقة هي تركيزك ، فلا تتردد في تخطي هذه الخطوة.
3. التحيز مقابل مفاضلة التباين: هذا موقف معروف ولكن كثيرًا ما نواجهه. نعلم جميعًا أن النماذج المعقدة يمكن أن تؤدي إلى فرط التجهيز في حين أن النماذج البسيطة يمكن أن تؤدي إلى نقص في التجهيز ، لذلك من الضروري إيجاد التوازن الصحيح. بعض الطرق العملية التي يمكنك من خلالها مكافحة هذه المشكلة هي ضبط المعلمات الفائقة ، والتأكد من أن بياناتك متوازنة ، وإجراء الاختبار المناسب وتقسيم التدريب ، وما إلى ذلك.
4. السرعة أو وقت التدريب: غالبًا ما تعني الدقة العالية وقت تدريب أعلى. من السهل تنفيذ الخوارزميات البسيطة مثل الانحدار الخطي وسريع التشغيل ، بينما قد تستغرق الخوارزميات المعقدة مزيدًا من وقت التدريب. قد تكون قادرًا على إجراء حل بديل بشأن وقت التدريب ، لكن هذا سيتطلب المزيد من الموارد الحسابية ، لذلك يعد هذا أمرًا شخصيًا جدًا لمؤسستك مرة أخرى.
يعد إنشاء نموذج ML ونشره عملية مرهقة للغاية ، لذا يرجى استخدام أداة إدارة المشروع لتتبع التقدم ، وإثارة المشكلات بشكل استباقي ، والتأكد من أن الجميع في نفس الصفحة.
قد يبدو إبقاء الجميع على اطلاع أمرًا شاقًا في البداية ولكنه سيتجنب الكثير من إعادة العمل والنفقات لاحقًا في هذه العملية. على الرغم من تعقيد هذه العملية ، فبمجرد أن تتمكن من رؤية وقياس تأثير التحليل أو النموذج الخاص بك ، ستبدو كل الأعمال المزعجة جديرة بالاهتمام.
تتفوق البيانات الأفضل دائمًا على الخوارزميات الأفضل ، لذلك هناك قيمة في إجراء استثمارات مناسبة لبناء خطوط بيانات فعالة وتخزينها.
مراجع
1.https: //towardsdatascience.com/the-actual-difference-between-statistics-and-machine-learning-64b49f07ea3
2. https://www.analyticsvidhya.com/blog/2015/07/difference-machine-learning-statistical-modeling/
3.https: //edvancer.in/an-easy-guide-to-help-you-choose-which-machine-learning-algorithm-to-choose-for-your-business-problem/
4. https://www.kdnuggets.com/2019/10/choosing-machine-learning-model.html
تم نشر Striking the Right Balance في الأصل في Towards AI on Medium ، حيث يواصل الأشخاص المحادثة من خلال تسليط الضوء على هذه القصة والرد عليها.
تم النشر عبر نحو الذكاء الاصطناعي