ستساعدك المقالة التالية: دورة حياة مشكلة التعلم الآلي – يكتب المبتدئين – نحو الذكاء الاصطناعي
نُشر في الأصل على نحو AI ، الشركة الرائدة في العالم في مجال الذكاء الاصطناعي والأخبار التقنية والإعلام. إذا كنت تقوم ببناء منتج أو خدمة متعلقة بالذكاء الاصطناعي ، فنحن ندعوك للتفكير في أن تصبح راعيًا للذكاء الاصطناعي. في نحو الذكاء الاصطناعي ، نساعد في توسيع نطاق الشركات الناشئة في مجال الذكاء الاصطناعي والتكنولوجيا. دعنا نساعدك على إطلاق التكنولوجيا الخاصة بك للجماهير.
أنا مبتدئ في ML (حسنًا ، هذا صحيح). أنا أكتب كل شيء وأنا أتعلم. إذا كان بإمكاني التوضيح ، فسيكون ذلك رائعًا! لقد تعلمت الكثير عن دورة حياة ML وفجأة خطرت في ذهني فكرة عشوائية ، “مرحبًا ، ماذا عن كتابة ما أعتقد أنه دورة حياة ML والسماح للآخرين بالقراءة والرد؟”. حسنا هيا بنا!
هناك عدد من المبرمجين والمهندسين في جميع أنحاء العالم الذين يكتبون التعليمات البرمجية كل يوم لتطوير البرمجيات. إنهم بالتأكيد يستخدمون بعض الأساليب لتطوير برامجهم والتي تشمل إنشاء الوثائق ، وإعداد التقارير الإلكترونية ، والعلائقية ، وحالة الاستخدام ، ومخطط التسلسل ، وما إلى ذلك. تمامًا مثل ذلك ، لدينا دورة حياة لتطوير حل تعلم الآلة الكامل لأي مشكلة معينة.
تساعد دورة حياة التعلم الآلي أو بكلمات بسيطة وخطوات التعامل مع أي مشكلة في تعلم الآلة أي شخص في الحصول على نتائج جيدة في وقت أقل. باختصار ، من خلال تطبيق هذه الطريقة ، يمكنك نشر النموذج الخاص بك بسرعة كبيرة والحصول على نتائج قوية. هذه عملية متكررة يمكنك تطبيقها في كل مرة تبدأ فيها العمل على مشكلة جديدة.
خطوات دورة حياة تعلم الآلة
- تحديد بيان المشكلة
- جمع البيانات
- تحضير البيانات
- تحليل البيانات
- اختيار النموذج والتدريب
- اختبار النموذج
- تعيين
هذه هي الخطوات الرئيسية للتعامل مع أي مشكلة في التعلم الآلي. على الرغم من أن هذه الخطوات تساعدك حقًا في حل أي مشكلة في تعلم الآلة بسرعة ، إلا أنه ليس من الضروري دائمًا اتباع كل خطوة. يمكنك إجراء تغييرات حسب مشكلتك.
إضافة إلى ذلك ، فهذه خطوات رئيسية ويمكن تقسيمها إلى خطوات أصغر ويتم تشجيع أي مهندس على تقسيم هذه الخطوات إلى أكبر عدد ممكن من الخطوات الأصغر للحفاظ على سهولة العمل. على سبيل المثال ، إذا كنت تعمل على مجموعة بيانات محددة أثناء العمل على الخطوة الثالثة ، أي تحليل البيانات ، فقد ترغب بالتأكيد في إنشاء أنواع مختلفة من المخططات والرسوم البيانية ، ووضع بعض الافتراضات بناءً على ذلك ، وإعداد بعض الجداول وكتابة النتائج التي توصلت إليها. تساعدك هذه الأشياء في العثور على أفضل خوارزمية لبياناتك والحصول على أفضل النتائج.
أيضًا ، عند بدء العمل ، ستكتشف أن العديد من هذه الخطوات مترابطة ومتكررة. أعني بالتكرار ، أن أقول إنك قد تحتاج إلى إجراء عدد من الخطوات الواحدة من المرات قبل أن تحصل على النتائج التي تريدها.
دعنا نتعمق في كل خطوة الآن.
تحديد بيان المشكلة
هذه هي الخطوة الأولى لأي مشكلة ML. تحتاج أولاً إلى فهم بيان المشكلة ووضع بعض الافتراضات بناءً على البيان. ثم تحتاج إلى مناقشة متطلبات حل المشكلة. لا يمكنك تحمل أي مشكلة وحلها إذا لم تحصل على فائدة معينة منها. يجب أن يكون هناك دافع معين للوصول إلى حل. الجزء الأخير من بيان المشكلة المحدد هو مناقشة النتائج المتوقعة من خلال حل المشكلة والمخرجات التي تريدها في نهاية الحل.
تربطك هذه الخطوات ببيان المشكلة ويمكنك اتخاذ قرارات أفضل. تذكر أنك لست مجرد مهندس ML ، أنت شخص يحل المشكلة للأشخاص ويساعدهم على الاستفادة من الحل.
جمع البيانات
قد تبدو هذه الخطوة محيرة للناس ، لذا قبل أن تبدأ بقول “يا رجل ، لا بد أن هذا الشخص يمزح” ، دعني أوضح أن هذه الخطوة موجودة في بعض المشاكل ، وفي معظم المشاكل ، تحصل على بيانات من الشخص أو المنظمة التي تعمل بها لذلك ، لا تحتاج إلى العثور على بيانات ولكن كما قلت ، فهي مطلوبة في بعض المشكلات ، قد أشرحها.
لنفترض أنك تعمل على مشكلة ML حيث تحتاج إلى الحصول على بيانات من الإنترنت ، فقد تحتاج إلى إجراء إلغاء على الويب لجمع البيانات. إذا كنت تعمل على حل مشكلة قدمتها بعض “الصناعات التقليدية” ، فأنت بحاجة إلى الحصول على بيانات من أجهزة استشعار أو طرق أخرى (لا تقلق ، فهذه الخطوات نادرة جدًا). يمكنك استخدام هذه البيانات بشكل أكبر.
تحضير البيانات
هذه الخطوة مهمة للغاية وتحتاج إلى تنفيذها على جميع مجموعات البيانات الواقعية تقريبًا. هناك احتمال ضئيل جدًا في حصولك على بيانات نظيفة ولا تتطلب إجراء إعداد بيانات على ذلك (Iris ، وهي مجموعة بيانات مشهورة جدًا ، نظيفة ومتوازنة ولكنك تستخدم ذلك فقط لممارسة المشكلات الأساسية).
لإعداد البيانات ، عليك أولاً التفكير في البيانات التي تريد استخدامها لمشكلة معينة. تريد أيضًا التفكير في البيانات التي تريد إضافتها إلى مجموعة البيانات.
بعد ذلك تأتي خطوة مهمة للغاية ، “معالجة البيانات”. في هذه الخطوة ، تحتاج إلى تنظيف البيانات. من خلال تنظيف البيانات ، ما أعنيه هو ، في أي بيانات واقعية ، هناك قيم معينة مفقودة ، وتحتاج البيانات إلى تنسيق ، وقد تختلف وحدات البيانات في بعض حالات مجموعة البيانات (سنناقش الحالات لاحقًا). تحتاج إما إلى إزالة القيم المفقودة أو تعبئتها. هناك طرق معينة لذلك. تحتاج إلى تطبيع وتوحيد بياناتك.
بعد ذلك ، تقوم بإجراء عمليات معينة مثل القياس وتحلل البيانات لجعل البيانات جاهزة لخوارزمية ML.
تذكر أن مقدار البيانات مهم ولكن جودة هذه البيانات أكثر أهمية وبالتالي قد ترغب في التركيز كثيرًا على هذه الخطوة. لا يمكنك تغذية أي بيانات إلى نموذج ML الخاص بك وتتوقع نتائج جيدة. البيانات مهمة كثيرًا!
تحليل البيانات
هذه مرة أخرى خطوة مهمة للغاية. بمجرد الانتهاء من معالجة البيانات بالتنسيق المطلوب ، قد ترغب في تصورها واستخلاص افتراضات معينة منها. في هذه الخطوة ، تحتاج إلى إتقان جيد في تخطيط وفهم المخططات والرسوم البيانية (يمكنك القيام بذلك باستخدام Python أو Excel أو أي أداة من اختيارك). يساعد في تحديد خوارزميات جيدة لمجموعات بيانات محددة وبيانات المشكلة.
هنا بشكل أساسي ، يمكنك تصور البيانات التي تمنحك فهمًا أفضل للأنماط في سمات معينة من البيانات. يساعد أيضًا في تجاهل السمات التي تجدها غير مفيدة لبيان مشكلتك. على سبيل المثال ، إذا كانت قيمة السمة المحددة هي نفسها تقريبًا لمجموعة البيانات بأكملها ، فربما لا تكون مفيدة جدًا في التنبؤ.
اختيار النموذج والتدريب
بمجرد حصولك على جميع البيانات وتصور البيانات لعمل افتراضات معينة ، فقد حان الوقت أخيرًا لاختيار النموذج وتدريبه على مجموعة البيانات الخاصة بنا. نحن في الأساس نستخدم بعض الأساليب لهذا الغرض.
نستخدم عمومًا التحقق المتقاطع k-fold للاختبار. يتم اختبار جميع مجموعات الخوارزميات والبيانات k مرة ونحصل على انحرافات معيارية ومتوسطة للجميع (إذا لم تكن على دراية بمفهوم المتوسط والانحراف المعياري ، فهما مفاهيم أساسية جدًا للإحصاء وسنناقش كل ذلك في الإحصائيات لـ ML).
في التحقق المتقاطع من k-fold ، نأخذ بعض خوارزميات ML (تلك هي بعض الخوارزميات التي يتم استخدامها بشكل متكرر ، على سبيل المثال خوارزميات ML القياسية) ونقوم بتشغيلها على مجموعة البيانات. هذه بعض الخوارزميات الرئيسية من عائلات مختلفة (قد ترغب في قراءة هذه المدونة الخاصة بجيسون براونلي ، دكتوراه).
هنا ، عليك أولاً أن تقرر نهجك ، أي إذا كنت تريد اتباع نهج خاضع للإشراف أو غير خاضع للإشراف أو شبه خاضع للإشراف. بمجرد أن تقرر ، تحتاج إلى تحديد الخوارزمية المحددة التي تريد استخدامها (في بعض الأحيان ، نستخدم أيضًا أساليب مختلطة). نتجاهل الطرق الأخرى ونضيق قائمة الخوارزميات لدينا ونستمر في القيام بهذه الخطوة في الطريقة التكرارية حتى نقرر خوارزمية مثالية (بالكمال ، أعني أننا نحصل على رؤية واضحة ، وليس بالضرورة الأفضل).
بعد اتخاذ قرار بشأن الخوارزمية ، نقوم بتدريب نموذجنا باستخدام مجموعة البيانات الخاصة بنا. نقسم مجموعة البيانات الخاصة بنا أساسًا إلى جزأين ، أحدهما للتدريب والآخر للاختبار. يمكنك اختيار 70:30 أو 80:20 أو أي نسبة ترغب في اختيارها لبيان مشكلتك.
بمجرد تدريب نموذج ML الخاص بك باستخدام مجموعة البيانات ، فقد حان الوقت لاختبار الدقة.
اختبار النموذج
نتحقق بشكل أساسي من نتائج الخوارزمية الخاصة بنا والنتائج الفعلية التي نعرفها بالفعل. لذلك يمكننا مقارنة النتائج المتوقعة بالنتائج الفعلية والحصول على دقة النموذج. هناك أيضًا خوارزميات اختبار معينة لاختبار نموذجنا. تحتاج إلى إعداد طريقة جيدة لاختبار الخوارزمية الخاصة بك لأن الدقة الفعلية مهمة جدًا. أنت تقوم بمقاييس الأداء والتحقق المتبادل وما إلى ذلك.
تحاول أيضًا معرفة التغيير في الخوارزمية الذي يمكن أن يزيد الدقة عن طريق الاختبار والتدريب مرة أخرى بعد إجراء التغيير. في الأساس ، يعد التدريب والاختبار أيضًا عملية تكرارية تستمر في تكرارها حتى تحصل على نتائج قريبة من النتائج التي تريدها. تقوم بإجراء ضبط الخوارزمية أو طرق التجميع لهذا الغرض.
تعيين
إن نشر النموذج ليس بالضرورة أن يقوم به مهندس ML. إنه أمر شخصي لملفك الشخصي في العمل ولكن من الجيد أن تتعلم الأساسيات على الأقل. تحتاج إلى شرح نتائجك للعميل في وقت ما لأن هناك احتمال أن عميلك ربما لا يكون على دراية تامة بتعلم الآلة ويريد النتائج في مصطلحات أو بطريقة بسيطة وسهلة الفهم. قد تحتاج إلى إنشاء لوحات معلومات أو نشر النموذج الخاص بك على سحابة أو تطبيق ويب إذا كنت تعمل كمهندس ML مستقل (الشركات لديها في الغالب أشخاص لذلك ولكن قد يحتاج مهندسو ML المستقلون إلى القيام بذلك).
ملخص
هنا ، لقد ناقشت دورة الحياة الكاملة لأي مشكلة وحل ML. نستخدم هذا النهج لتقليل عدم اليقين في العملية وجعل الأمور واضحة ومعالجة سريعة ونتائج قوية.
يمكن أن يساعدك اتباع هذه الطريقة في تنظيم العملية بأكملها حيث يمكنك تعديل أي خطوة في أي وقت وتحسين الأمور.
هذا كل شيء لليوم ، أراكم جميعًا في المنشور التالي!
دورة الحياة لمشكلة التعلم الآلي – نُشرت كتابات المبتدئين في الأصل في Towards AI on Medium ، حيث يواصل الأشخاص المحادثة من خلال تسليط الضوء على هذه القصة والرد عليها.
تم النشر عبر نحو الذكاء الاصطناعي