الأخبار التكنولوجية والاستعراضات والنصائح!

هل تواجه صعوبة في بناء النموذج المثالي؟ – نحو الذكاء الاصطناعي

ستساعدك المقالة التالية: هل تواجه صعوبة في بناء النموذج المثالي؟ – نحو الذكاء الاصطناعي

وجدت نتائج دراسة حديثة أجريت على أكثر من 23000 متخصص في البيانات أن علماء البيانات يقضون حوالي 40٪ من جمع البيانات وتنظيفها ، و 20٪ من وقتهم في بناء النماذج واختيارها ، و 11٪ من وقتهم في إيجاد الأفكار وإيصالها إلى أصحاب الأسهم. كمبتدئ ، قد تواجه صعوبة في العثور على النموذج المثالي لبيان مشكلتك.

لذا أقدم لك هنا PyCaret تعلمًا آليًا مفتوح المصدر ومنخفض الكود في Python يسمح لك بالانتقال من إعداد بياناتك إلى نشر النموذج الخاص بك في غضون ثوانٍ في بيئة الكمبيوتر المحمول التي تختارها.

دعنا ندخل بسرعة في التثبيت ونبني نموذجًا مثاليًا.

الخطوة 1: إنشاء بيئة افتراضية

يوصى باستخدام بيئة افتراضية مثل بيئة python3 الافتراضية أو بيئات Conda. بحيث لا يتعارض مع حزم أخرى مثبتة. تتمثل ميزة استخدام بيئة افتراضية في أنه يمكننا تنزيل إصدار محدد من أي مكتبة نريد استخدامها.

سيستغرق التثبيت حوالي 5 إلى 10 دقائق حسب سرعة الإنترنت لديك. إذا وجدت أي مشكلة في تثبيت المكتبة ، فانتقل إلى الوثائق الرسمية (انقر هنا).

الخطوة 2: تحقق من تثبيته بشكل صحيح

  1. محطة الأوامر

قم بتنشيط بيئة conda أو python الخاصة بك في Terminal ثم اكتب الكود التالي.

يجب أن تحصل على الإخراج التالي.

أنا أستخدم Ubuntu كنظام التشغيل الخاص بي حتى يبدو نظامك مختلفًا.

2. دفتر Jupyter

اكتب الكود أعلاه وقم بتشغيل خلية jupyter الخاصة بك. سوف تحصل على رقم الإصدار كإخراج.
لقد نجحت الآن في تثبيت مكتبة PyCaret في جهازك.
دعني أوضح لك كيفية استخدامه من خلال حل مشكلة الانحدار.

الاستخدام العملي

عرض المشكلة:

قم ببناء نموذج يمكنه التنبؤ بمؤشر كتلة الجسم لشخص ما باستخدام الطول والوزن كميزات الإدخال.

يمكنك الحصول على مجموعة البيانات من رابط Github أدناه.

HemanthDavuluri / MediumBlog

الخطوة 1: قم بتحميل البيانات

Note: لقد استخدمت بيئة دفتر Kaggle

الخطوة 2: تقسيم القطار ومجموعة الاختبار

Note: عدد الأعمدة في البيانات للنمذجة يساوي البيانات غير المرئية للتنبؤات وقد يبدو هذا غريبًا بالنسبة لأولئك الذين هم على دراية باستخدام Sklearn.
لا يوجد ما يدعو للقلق يعمل PyCaret بهذه الطريقة. ستفهمها بوضوح في الوقت الذي نتوقع فيه البيانات غير المرئية باستخدام النموذج المدرب.

الخطوة 3: إعداد بيئة Pycaret

تعمل وظيفة الإعداد على تهيئة البيئة المطلوبة لـ Pycaret لإنشاء خط أنابيب التحويل لنمذجة البيانات ونشرها. تذكر أنه يجب استدعاء وظيفة الإعداد قبل استخدام أي من وظائف Pycaret. تأخذ الدالة وسيطتين رئيسيتين البيانات والهدف. البيانات هي مجموعة البيانات التي نستخدمها والهدف هو اسم العمود التابع. عند تشغيل الوظيفة ، يتم إنشاء جدول كما هو موضح في الصورة أدناه. إذا كانت جميع أنواع البيانات موجودة في مجموعة البيانات وتم عرضها بشكل صحيح ، فاضغط على Enter لمتابعة التجربة. تؤدي الوظيفة مهام المعالجة المسبقة اللازمة لأي تجربة تعلم آلي.

تعريفات الكلمات الرئيسية الرئيسية التي يجب أن تعرفها

  • معرف جلسة العمل: يتم إنشاء رقم عشوائي واستخدامه للتكاثر في وقت لاحق. إذا لم تقم بتهيئة المتغير ، فستقوم الوظيفة تلقائيًا بتعيين 123 كمعرّف الجلسة.
  • البيانات الأصلية: يعرض شكل مجموعة البيانات.
  • قيم مفقودة: يعرض قيمة منطقية إذا كانت البيانات مفقودة في مجموعة البيانات. يظهر صحيح إذا كانت هناك بيانات مفقودة ويظهر خطأ إذا لم تكن هناك قيم مفقودة.
  • الميزات الرقمية: عدد الميزات التي يتم استنتاجها على أنها رقمية.
  • الميزات الفئوية: يتم عرض عدد الميزات الفئوية.
  • مجموعة القطار المتحولة: يعرض شكل إطار البيانات المحول بعد المعالجة المسبقة.
  • مجموعة الاختبار المحولة: يعرض شكل القطار المحول ومجموعة الاختبار. القيمة الافتراضية هي 70 بالمائة لمجموعة القطار و 30 لمجموعة التدريب.

الخطوة 4: مقارنة جميع النماذج

يبدأ استدعاء الوظيفة هذا في مقارنة جميع النماذج بناءً على أدائها. يوصى بهذا لنمذجة البيانات بمجرد اكتمال الإعداد. يتم تدريب جميع النماذج وتسجيلها باستخدام التحقق من صحة التسجيل k-fold للتقييم. يُنشئ ناتج هذه الوظيفة جدولاً مع اسم النموذج ، MAE ، MSE ، RMSE ، R2 ، RMSLE ، و MAPE كأعمدة. يقوم استدعاء الوظيفة هذا بالعمل الشاق ويوفر الكثير من الوقت. اعتمادًا على حجم مجموعة البيانات ، قد تستغرق هذه الخطوة وقتًا حتى تنتهي.

قامت بتدريب 21 عارضًا وترتيبهم بالترتيب من الأفضل إلى الأسوأ. الآن هو خيارك لاختيار أفضل طراز لك.
أفضل خوارزمية تعمل بشكل جيد مع بيان مشكلتي هي Extra Tree’s Regressor.

الخطوة 5: قم بإنشاء النموذج

بعد مقارنة النماذج ، لا تقوم الوظيفة بإرجاع النماذج المدربة. يتعين علينا إنشاء النموذج باستخدام إنشاء وظيفة النموذج وتقوم الوظيفة بإرجاع شبكة مع جميع الدرجات كما في الخطوة أعلاه

يمكنك أن تجد جميع النماذج الموصوفة هنا.

انتاج:

لمشاهدة جميع المعلمات التشعبية المستخدمة في النموذج ، قم بطباعة النموذج باستخدام سطر التعليمات البرمجية هذا.

انتاج:

الخطوة 6: ضبط النموذج

يستخدم النموذج الذي تم إنشاؤه في الخطوة أعلاه معلمات تشعبية افتراضية وقد لا يكون النموذج فعالاً للغاية. لذا فإن ضبط النموذج مطلوب لوظيفة نموذج الضبط. تقوم هذه الوظيفة تلقائيًا بضبط المعلمات الفائقة وتسجيلها باستخدام التحقق المتقاطع k-fold. الإخراج طباعة شبكة مع جميع درجات النموذج الذي تم ضبطه.

Note: tune_model () لا يأخذ كائن نموذج مدرب كمدخل (الاسم المختصر للنموذج كما في وظيفة نموذج الإنشاء)

انتاج:

يمكنك طباعة النموذج ومشاهدة المعلمات التشعبية المضبوطة.

الخطوة 7: ارسم النموذج

قبل الانتهاء ، يمكننا رسم النموذج باستخدام وظيفة نموذج الرسم لتحليل الأداء عبر جوانب مختلفة. تأخذ هذه الوظيفة نموذجًا مدربًا كوسيطة وتعيد مخططًا بناءً على مجموعة الاختبار. هناك 10 أنواع من قطع الأرض المتاحة لمزيد من المعلومات ، راجع الوثائق.

انتاج:

هناك العديد من المؤامرات الأخرى التي يمكنك تجربتها. راجع الوثائق.

الخطوة 8: الوضع التفاعلي لتحليل أداء النموذج

واحدة من أفضل الوظائف التي وجدتها مفيدة في Pycaret هي نموذج التقييم. تعرض هذه الوظيفة واجهة مستخدم لجميع المخططات المتاحة لطراز معين. يتم استخدام وظيفة نموذج الرسم لإنشاء جميع المؤامرات داخليًا في هذه الوظيفة.

انتاج:

يمكنك تحديد نوع قطعة الأرض لأن هذا كله تفاعلي.

الخطوة 9: افحص النموذج قبل الإنهاء

تتمثل الخطوة المهمة الرئيسية في العملية برمتها في التحقق من النموذج قبل الانتهاء منه. من الممارسات الجيدة إجراء فحص نهائي واحد من خلال مجموعة اختبار التنبؤ وتقييم الدرجات.

انتاج:

الخطوة 10: إنهاء النموذج للنشر

الخطوة 11: توقع البيانات غير المرئية

اطبع إطار بيانات التنبؤ الجديد.

إذا نظرت باهتمام شديد إلى إطار البيانات ، فلديك عمود جديد يسمى “Label” وهو ليس سوى عمود القيم المتوقعة.

أعتقد الآن أنه من المنطقي وجود 3 أعمدة في مجموعة البيانات غير المرئية كمجموعة قطار (بيانات).

الخطوة 12: احفظ النموذج

من خلال القيام بذلك ، يمكنك استخدام النموذج الخاص بك على البيانات الجديدة وقتما تشاء. تحتاج إلى متابعة العملية بأكملها مرة أخرى إذا قمت بحفظ النموذج الخاص بك.

تأخذ وظيفة حفظ النموذج وسيطتين أحدهما هو اسم النموذج والثاني هو الاسم الذي تريد حفظ النموذج به.

لإعادة استخدام النموذج مرة أخرى جرب الكود التالي.

انتاج:

بمجرد تحميل النموذج في البيئة ، يمكنك ببساطة استخدامه للتنبؤ بأي بيانات جديدة باستخدام نفس وظيفة التنبؤ ().

خاتمة

استغرق الأمر 7 دقائق فقط لتثبيت المكتبة والعثور على نموذج مثالي.

هل أنت راضٍ جدًا عن PyCaret؟
ماذا تنتظر؟
ابدأ بتنفيذ مشاريعك ووفر وقتك الثمين لأنني أقوم بحفظ مقالاتي وكتابة المقالات من أجلك.
سيكون موضع تقدير المتابعة والتصفيق. شكرا على القراءة حتى النهاية.
أراك المرة القادمة.


هل تواجه صعوبة في بناء النموذج المثالي؟ نُشر في الأصل في Towards AI – Multidisciplinary Science Journal on Medium ، حيث يواصل الأشخاص المحادثة من خلال تسليط الضوء على هذه القصة والرد عليها.

تم النشر عبر نحو الذكاء الاصطناعي