الأخبار التكنولوجية والاستعراضات والنصائح!

الاستفادة من بيانات الهاتف المحمول من خلال التعلم الآلي لاستهداف الفقر المدقع ومكافحته

ستساعدك المقالة التالية: الاستفادة من بيانات الهاتف المحمول من خلال التعلم الآلي لاستهداف الفقر المدقع ومكافحته

توفر أنظمة الحماية الاجتماعية مساعدة حاسمة أثناء الأزمات ، وتزيد الإنتاجية ، وتحمي الفئات الضعيفة من السكان. مع جائحة COVID-19 ، ارتفع الفقر المدقع العالمي لأول مرة منذ عقدين ، مما يجعل الحاجة إلى برامج حماية اجتماعية فعالة أكثر إلحاحًا من أي وقت مضى. ومع ذلك ، فإن استهداف الأسر المؤهلة في البلدان المنخفضة والمتوسطة الدخل يمثل تحديًا كبيرًا ، حيث أن البيانات الإدارية التقليدية ، مثل السجلات الضريبية ، غالبًا ما تكون غير متوفرة بسبب وجود نسبة كبيرة من العمال غير الرسميين.

هذا ورق، الذي قدمه باحثون من جامعة كاليفورنيا في بيركلي والبنك الدولي ، يوضح أن استخدام التعلم الآلي على البيانات الإدارية غير التقليدية ، مثل سجلات تفاصيل المكالمات (CDRs) من مشغل هاتف محمول كبير في أفغانستان ، قد برز كحل واعد للاستهداف الأسر شديدة الفقر في برنامج الحكومة لمكافحة الفقر. تحتوي سجلات CDR على معلومات حول أرقام الهواتف وأنماط الاتصال وشبكة جهات الاتصال وأنماط إعادة الشحن ، من بين أمور أخرى.

تقوم الورقة بتقييم ومقارنة ثلاث طرق لتحديد الأسر شديدة الفقر بشكل صحيح ، وهي نموذج التعلم الآلي الخاضع للإشراف والمدرّب على بيانات مجلس الإنماء والإعمار ، ومؤشر الثروة القائم على الأصول ، ومقياس الاستهلاك ، والذي يستخدم بشكل شائع كمؤشر لقياس الفقر في البلدان المنخفضة. – والبلدان ذات الدخل المتوسط. تم تدريب خوارزمية التعلم الآلي الخاضعة للإشراف على 797 مؤشرًا سلوكيًا تم حسابها من بيانات CDR ، والتي تضمنت أنماط الاتصال ، وشبكة من جهات الاتصال ، والأنماط المكانية ، وأنماط إعادة الشحن ، باستخدام نموذج تعزيز التدرج الذي تفوق على خوارزميات التعلم الآلي الشائعة الأخرى. بالإضافة إلى ذلك ، تفحص الورقة الدقة التي تم تحقيقها من خلال طريقة مجمعة تستخدم الانحدار اللوجستي لتصنيف الأسر شديدة الفقر والأسر غير شديدة الفقر من خلال الاستفادة من الطرق الثلاثة المذكورة أعلاه. لتقييم دقة كل طريقة ، استخدمت الدراسة منحنيات ROC والاستدعاء الدقيق وحسبت الانحراف المعياري لمقاييس الدقة باستخدام 1000 عينة تم تشغيلها.

تم العثور على دقة الطريقة القائمة على مجلس الإنماء والإعمار في تحديد الأسر شديدة الفقر لتكون قابلة للمقارنة مع الطريقتين الأخريين ، حيث حققت دقة واسترجاع 42٪ (مقارنة بـ 49٪ للطريقة القائمة على الأصول و 45٪ للاستهلاك. الطريقة المستندة). تم تقييم المفاضلة بين الإيجابيات الكاذبة والسلبيات الخاطئة باستخدام منحنيات ROC ، كما تم العثور على درجات المنطقة تحت المنحنى (AUC) لتكون قابلة للمقارنة بين الطرق ، مع الطريقة القائمة على الأصول التي تفوقت قليلاً على الاستهلاك القائم على CDR الطرق المستندة (AUC = 0.73 و 0.71 و 0.68 على التوالي).

أظهرت الطريقة المجمعة ، التي استخدمت الانحدار اللوجستي لتصنيف الأسر شديدة الفقر وغير شديدة الفقر من خلال الاستفادة من الطرق الثلاثة ، النتائج الواعدة مع AUC بقيمة 0.78 ، متفوقة على الطرق الفردية باستخدام أي واحد أو اثنين من مصادر البيانات. . ومع ذلك ، نظرًا لعدم جدوى جمع بيانات الاستهلاك لعدد كبير من السكان ، فإن الطريقة المدمجة باستخدام بيانات سجل الإنماء والإعمار وبيانات الأصول فقط قد تكون الخيار الأكثر جدوى (AUC = 0.76).

ميزة أخرى مهمة للاستهداف المستند إلى CDR هي أنه يمكن أن يقلل الوقت والتكاليف الهامشية المطلوبة لتنفيذ برنامج مستهدف عند مقارنته بالطرق المستخدمة حاليًا (اختبارات الوسائل البديلة ، أو الاستهداف المستند إلى المجتمع ، أو الاستهداف القائم على الاستهلاك) . على سبيل المثال ، يُقدر أن الاستهداف المستند إلى المجتمع واختبارات الوسائل البديلة تضيف 276 ألف دولار و 503 ألف دولار على التوالي ، بما يعادل 2.18٪ و 3.97٪ من إجمالي ميزانية البرنامج ، في حين أن التكلفة الحدية لفحص الأسرة باستخدام مجلس الإنماء والإعمار هي ضئيلة.

إن استخدام بيانات مجلس الإنماء والإعمار في الاستهداف يثير مخاوف وقيود أخلاقية يجب أخذها في الاعتبار. أولاً ، الوصول إلى بيانات الهاتف ضروري ، وستتأثر دقة الاستهداف إذا كانت البيانات غير متوفرة لبعض شرائح السكان (مثل أولئك الذين ليس لديهم هاتف أو إذا كان مزود معين لا يسمح بالوصول إلى البيانات). ثانيًا ، يتضمن الاستهداف المستند إلى مجلس الإنماء والإعمار الوصول إلى المعلومات الحساسة والخاصة ، بما في ذلك أرقام الهواتف وآثار المواقع ، مما يستلزم الموافقة المستنيرة ومعايير الخصوصية الواضحة التي لا توجد اليوم. أحد الحلول المحتملة لتقليل مخاطر الخصوصية هو تقليل البيانات ، والذي يقيد النماذج بالميزات التي تشكل أقل مخاطر على الخصوصية ، ولكن هذا قد يؤدي إلى انخفاض في دقة الاستهداف. أخيرًا ، قد يؤدي استخدام CDR لأهلية البرنامج إلى خلق حوافز للسلوك الاستراتيجي من قبل الأفراد الذين يرغبون في التلاعب بالنظام ، مثل الامتناع عن استخدام هواتفهم. حتى إذا كانت خوارزميات التعلم الآلي المعقدة قد تقلل من نطاق التلاعب ، فغالبًا ما يطلب المجتمع الشفافية في اتخاذ القرارات الحسابية لأن قرارات الصندوق الأسود يصعب تدقيقها أو محاسبتها.

في الختام ، فإن تكامل التعلم الآلي مع بيانات CDR لديه القدرة على إحداث ثورة في استهداف التدخلات الاقتصادية أو برامج المساعدة من خلال تقليل التكاليف واستكمال الأساليب القائمة على المسح. ومع ذلك ، يجب مراعاة المخاوف العملية والأخلاقية ، مثل الوصول إلى البيانات ، وقضايا الخصوصية ، والتلاعب المحتمل بالبيانات. من الضروري موازنة هذه القيود مقابل الفوائد المحتملة للاستهداف المستند إلى مجلس الإنماء والإعمار في كل سياق محدد. مع استمرار تطور التعلم الآلي وتشكيل العالم ، من الأهمية بمكان التعامل مع تطبيقاته بشكل مدروس ومسؤول ، وضمان توافقها مع المعايير الأخلاقية وإعطاء الأولوية لرفاهية الأفراد والمجتمعات.