الأخبار التكنولوجية والاستعراضات والنصائح!

شرح 5 مقاييس الانحدار في 5 دقائق فقط – نحو الذكاء الاصطناعي

ستساعدك المقالة التالية: شرح 5 مقاييس الانحدار في 5 دقائق فقط – نحو الذكاء الاصطناعي

نُشر في الأصل على نحو AI ، الشركة الرائدة في العالم في مجال الذكاء الاصطناعي والأخبار التقنية والإعلام. إذا كنت تقوم ببناء منتج أو خدمة متعلقة بالذكاء الاصطناعي ، فنحن ندعوك للتفكير في أن تصبح راعيًا للذكاء الاصطناعي. في نحو الذكاء الاصطناعي ، نساعد في توسيع نطاق الشركات الناشئة في مجال الذكاء الاصطناعي والتكنولوجيا. دعنا نساعدك على إطلاق التكنولوجيا الخاصة بك للجماهير.

ما هي مقاييس الانحدار المختلفة؟ هل يمكن أن تصبح النتيجة R2 0؟ متى تصبح درجة R2 سلبية؟ ما هي الاختلافات بين MAE و MSE؟ ما هي درجة R2 المعدلة؟

إذا كنت تريد معرفة إجابات الأسئلة أعلاه فأنت في المكان الصحيح….

أ تراجع المشكلة هي نوع من نهج التعلم الآلي الخاضع للإشراف حيث يكون متغير المخرجات قيمة حقيقية أو مستمرة ، مثل “الراتب” أو “الوزن”. من ناحية أخرى ، أ تصنيف المشكلة هي نوع حيث سيكون الإخراج فئويًا ، مثل التنبؤ بالإخراج مثل “كلب” أو “قطة”.

في هذه المقالة ، نناقش مقاييس الانحدار. لكل من المقاييس مزاياه وعيوبه… .. بالنسبة لمقاييس التصنيف ، يمكنك قراءة مدونة مقاييس التصنيف.

ضع في اعتبارك مشكلة الانحدار حيث يكون الإدخال سنوات من الخبرة والإخراج مرتب. توضح الصورة أدناه خط الانحدار الخطي المرسوم للتنبؤ بالراتب.

تُظهر القيم الفعلية والمتوقعة للراتب أن النموذج يرتكب بعض الأخطاء ، لذلك بمساعدة مقياس مناسب ، نحتاج إلى تحديد مدى جودة نموذجنا … دعونا نناقش مختلف مقاييس الانحدار الشائعة الاستخدام.

متوسط ​​الخطأ المطلق (MAE):

متوسط ​​الخطأ المطلق (MAE) هو أبسط مقياس انحدار. هنا نأخذ الفرق بين كل من القيم الفعلية والمتوقعة ونجمعها ، وأخيراً نقسم على عدد الملاحظات. لكي يعتبر نموذج الانحدار نموذجًا جيدًا ، يجب أن يكون MAE في أدنى حد ممكن.

مزايا MAE:

  • بسيط وسهل التفسير. سيكون للنتيجة نفس وحدة الإخراج. على سبيل المثال: إذا كان عمود الإخراج يحتوي على وحدة LPA ، فعندئذٍ إذا كان MAE هو 1.2 ، فيمكننا تفسير أن النتيجة هي + 1.2LPA أو -1.2LPA
  • يعتبر MAE قويًا نسبيًا إلى القيم المتطرفة (عند مقارنته ببعض مقاييس الانحدار الأخرى ، فإن MAE أقل تأثراً بالقيم المتطرفة).

عيوب MAE:

  • تستخدم MAE وظيفة المعامل ، لكن دالة المعامل غير قابلة للتفاضل في جميع النقاط ، لذلك لا يمكن استخدامها كدالة خسارة في كثير من الحالات.

متوسط ​​الخطأ التربيعي (MSE):

في متوسط ​​الخطأ التربيعي (MSE) ، نأخذ الفرق بين كل من القيم الفعلية والمتوقعة ثم نجمع الفرق ونضيفها ونقسمها في النهاية على عدد الملاحظات. لكي يعتبر نموذج الانحدار نموذجًا جيدًا ، يجب أن يكون MSE في أدنى حد ممكن.

مزايا MSE:

  • دالة التربيع قابلة للتفاضل في جميع النقاط ، وبالتالي يمكن استخدامها كدالة خسارة.

مساوئ MSE:

  • نظرًا لأن MSE يستخدم الدالة التربيعية ، فستكون النتيجة الوحدة التي تكون مربعًا للمخرجات. لذلك ، من الصعب تفسير النتيجة. سيحتوي MSE على وحدة LPA.
  • نظرًا لأنه يستخدم دالة مربعة ، إذا كانت هناك قيم متطرفة في البيانات ، فسيتم تربيع الفرق ، ونتيجة لذلك ، فإن MSE ليس قويًا بالنسبة للقيم المتطرفة.

خطأ جذر متوسط ​​التربيع (RMSE):

في الجذر التربيعي للخطأ المتوسط ​​(RMSE) ، نأخذ الفرق بين كل من القيم الفعلية والمتوقعة ، ثم نربّع الفرق ونضيفها ونقسمها في النهاية على عدد الملاحظات. ثم خذ الجذر التربيعي للنتيجة. لذلك ، RMSE ليست سوى الجذر التربيعي لـ MSE. لكي يعتبر نموذج الانحدار نموذجًا جيدًا ، يجب أن يكون RMSE في أدنى حد ممكن.

مزايا وعيوب RMSE:

  • إنه يحل مشكلة MSE ، ستكون الوحدة هي نفسها وحدة الإخراج حيث تأخذ الجذر التربيعي ، لكنها مع ذلك ليست قوية بالنسبة إلى القيم المتطرفة.

تعتمد المقاييس المذكورة أعلاه على سياق المشكلة التي نحلها ، مما يعني أن هناك الكثير من الاختلاف إذا كان MAE هو 1.2 من حيث الراتب ومن حيث السنتيمترات. لا يمكننا أن نقول فقط أن النموذج جيد أو سيئ من خلال النظر إلى قيم MAE و MSE و RMSE دون معرفة المشكلة الفعلية.

درجة R2:

ضع في اعتبارك أنه ليس لدينا أي بيانات إدخال ، وإذا أراد شخص ما معرفة مقدار الراتب الذي يمكن أن يحصل عليه في هذه الشركة ، فإن أفضل شيء يمكننا القيام به هو منحهم متوسط ​​الراتب لجميع الموظفين.

تعطي درجة R2 قيمة بين 0 إلى 1، والتي يمكن تفسيرها لأي سياق. يمكن أن يطلق عليه خير الملاءمة.

SSR هو مجموع تربيع الخطأ في خط الانحدار و SSM هو مجموع مربع الخطأ للخط المتوسط. نحن هنا نقارن خط الانحدار بخط المتوسط.

بعض النقاط المهمة فيما يتعلق بدرجة R2:

  • إذا كان النتيجة R2 هي 0، هذا يعني أن نموذجنا جيد مثل خط الوسط ، لذا نحتاج إلى تحسين نموذجنا.
  • إذا كان النتيجة R2 هي 1، إذن يصبح الجزء الصحيح من المعادلة 0 ، وهو ما يمكن أن يحدث فقط عندما يناسب نموذجنا كل نقطة بيانات ولا يرتكب أي خطأ يصعب تحقيقه عمليًا.
  • إذا كان نتيجة R2 سلبية، فهذا يعني أن الجانب الأيمن من المعادلة أكبر من 1 وهو ما يمكن أن يحدث عند SSR> SSM. معنى أن نموذجنا هو أسوأ من الخط المتوسط.

يمكن أيضًا تفسير R2 على النحو الوارد أدناه.

إذا كانت درجة R2 الخاصة بنموذجنا تساوي 0.8 ، فهذا يعني أنه يمكننا القول إن نموذجنا قادر على شرح 80٪ من تباين الناتج. أي 80٪ من التباين في الراتب يمكن تفسيره بالمدخلات (سنوات الخبرة) ، أما الباقي 20٪ غير معروف.

إذا كان نموذجنا يحتوي على عامين من الخبرة ودرجة الاختبارات ، فإن نموذجنا قادر على شرح 80٪ من الاختلاف في الراتب باستخدام ميزتي الإدخال.

مساوئ درجة R2:

  • مع زيادة عدد ميزات الإدخال ، تميل درجة R2 إلى الزيادة وفقًا لذلك أو ستظل كما هي ولكنها لن تنخفض أبدًا ، على الرغم من أن ميزات الإدخال ليست مهمة لنموذجنا (على سبيل المثال ، إضافة ميزة درجة الحرارة إلى مثالنا ، على الرغم من أن درجة الحرارة لا تضيف أي أهمية لمخرجاتنا).

درجة R2 المعدلة:

في الصيغة أعلاه ، R2 هي نتيجة R2 ، ن هو عدد المشاهدات (الصفوف) و ص هو عدد الميزات المستقلة. درجة R2 المعدلة تحل مشكلة درجة R2.

ضع في اعتبارك الحالتين التاليتين:

  1. عندما نضيف ميزات ليست مهمة جدًا إلى نموذجنا ، مثل إضافة درجة الحرارة للتنبؤ بالراتب… ..

2. عندما نضيف الميزات المهمة لنموذجنا ، مثل إضافة درجات الاختبار للتنبؤ بالراتب….

لذلك فهمت المقاييس المختلفة المستخدمة في مشاكل الانحدار مع مزاياها وعيوبها. شكرا لقرائتك……

يمكنك أن تقرأ عن مقاييس التصنيف في المدونة أدناه.

الارتباك مصفوفة

إذا كنت مرتبكًا بشأن التطبيع والتوحيد ، فيمكنك قراءة المدونة أدناه.

ما هي تقنية التحجيم التي يجب استخدامها – التقييس مقابل التطبيع.

يمكنك التواصل معي على LinkedIn.

اقتراحات تقديم Mlearning.ai


تم نشر 5 مقاييس الانحدار التي تم شرحها في 5 دقائق فقط في الأصل نحو الذكاء الاصطناعي على المتوسط ​​، حيث يواصل الناس المحادثة من خلال تسليط الضوء على هذه القصة والرد عليها.

تم النشر عبر نحو الذكاء الاصطناعي