ستساعدك المقالة التالية: حماية خصوصية البيانات المالية: استكشاف تقنيات توليد البيانات التركيبية في الشؤون المالية
في العصر الرقمي الحديث ، غالبًا ما تكون البيانات سلعة يتم شراؤها وبيعها وتداولها مثل أي أصل آخر. ومع ذلك ، عندما يتعلق الأمر بمجموعات البيانات المالية ، غالبًا ما تكون المعلومات الواردة فيها حساسة ويمكن التعرف عليها ، مما يجعلها تخضع لقوانين الخصوصية الصارمة. بسبب هذه اللوائح ، فإن استخدام وتوزيع البيانات المالية لأغراض البحث خارج المؤسسات المالية مقيد بشدة.
أحد الحلول المحتملة لتحديات قوانين الخصوصية الصارمة على مجموعات البيانات المالية هو إنشاء بيانات اصطناعية. يتضمن هذا النهج إنشاء بيانات مزيفة تحاكي خصائص البيانات الحقيقية ، وتحمي سرية المعلومات الشخصية للعملاء. يسمح استخدام البيانات الاصطناعية للباحثين بإجراء التحليلات والتنبؤات دون المساس بخصوصية العملاء.
سلطت دراسة حديثة من المملكة المتحدة الضوء على إمكانية استخدام البيانات التركيبية للتغلب على قيود الخصوصية في التمويل. تبحث الدراسة في التحديات والمتطلبات لاستخدام تقنيات توليد البيانات والبيانات التركيبية.
حدد مؤلفو الدراسة ثلاثة متطلبات رئيسية للأطر التوليدية لإنشاء بيانات مالية تركيبية:
- القدرة على إنشاء أنواع متعددة من البيانات المالية ، بما في ذلك البيانات الفئوية والثنائية والمعقدة والرقمية.
- يجب أن يكون للعملية التوليدية القدرة على إنتاج أعداد عشوائية من نقاط البيانات.
- يجب ضبط سرية مجموعات البيانات المالية بدقة مقابل مدى قيمة البيانات وقربها من الحقيقة.
يؤكد المؤلفون على أن إنشاء البيانات المالية التركيبية يحمي معلومات العملاء الحساسة ويمكن استخدامها دون المساس بخصوصية العميل. كما لاحظوا أن التقنيات التوليدية لا تتعلم إلا خصائص مجموعات البيانات الحقيقية ، مما يجعل من المستحيل على المحتالين إساءة استخدام مجموعات البيانات الأصلية.
بالإضافة إلى ذلك ، قدم الباحثون عدة أسباب لضرورة إنشاء بيانات تركيبية في مجال التمويل. أولاً ، نظرًا للقيود التنظيمية ، غالبًا ما تكون مجموعات البيانات الواقعية غير متاحة للاختبار والبحث ، مما يجعل تدفقات البيانات التركيبية مفيدة كبيانات غير واقعية. ثانيًا ، قد تمنع قوانين الخصوصية الشركات من مشاركة بيانات العملاء ، ولكن يمكن استخدام البيانات التركيبية لتلبية احتياجات المؤسسات المالية للبحث والتطوير. ثالثًا ، غالبًا ما تفشل خوارزميات التعلم العميق التقليدية بسبب مشكلة مشاكل الفصل غير المتوازنة ، والتي يمكن حلها من خلال البيانات الاصطناعية وأساليب احتساب البيانات. بالإضافة إلى ذلك ، يمكن استخدام البيانات التركيبية لتدريب النماذج من خلال تقنيات التعلم الآلي العميقة ومشاركة البيانات بين المؤسسات المالية.
وفقًا للمقال ، هناك حلان تقنيان لإنشاء بيانات مالية تركيبية: إنشاء بيانات مجدولة وبيانات مالية متسلسلة زمنية اصطناعية. يمكن إنشاء البيانات الجدولية باستخدام طرق مختلفة ، بما في ذلك شبكات GAN الشرطية و VAEs و PATE-GAN ، بينما تعد CT-GAN مناسبة لتشفير المتغيرات المستمرة وغير المستمرة. ومع ذلك ، فإن هذه الأساليب تعالج بشكل جزئي فقط مخاوف الخصوصية. فيما يتعلق بالبيانات المالية للسلاسل الزمنية الاصطناعية ، اقترح العلماء Quant-GAN و CGAN للتنبؤ بالنمذجة والسلاسل الزمنية. هذه النماذج مفيدة لسجلات إرجاع الأدوات المالية ونماذج السلاسل الزمنية ذات الصلة ولكنها لا تقدم ضمانات الخصوصية.
تتضمن تقنيات توليد البيانات التركيبية المذكورة في الورقة طرق التعلم الآلي الخاضعة للإشراف وغير الخاضعة للإشراف والتقنيات الهجينة. يمكن استخدام هذه التقنيات للكشف عن الاحتيال في بطاقة الائتمان وتتضمن جمع المعلومات حول مجموعة البيانات والتدريب واختبار مجموعات البيانات الفرعية وتقييم الأداء باستخدام مقاييس مختلفة مثل مصفوفة الارتباك و FPR والاستدعاء والدقة ونقاط F1 ومعدل الدقة. وجدت إحدى الدراسات أن خوارزمية الغابة العشوائية لديها أعلى دقة للكشف عن الاحتيال في بطاقات الائتمان. تضمنت التقنيات الأخرى المستخدمة في الدراسة الشبكات العصبية الاصطناعية ، ومصنفات الأشجار ، و Naive Bayes ، وآلات ناقلات الدعم ، ومصنفات تعزيز التدرج ، ونهج الانحدار اللوجستي.
في الختام ، فإن استخدام مجموعات البيانات المالية للبحث خارج المؤسسات المالية مقيد بشدة بسبب قوانين الخصوصية. ومع ذلك ، يمكن أن يساعد إنشاء البيانات الاصطناعية في التغلب على هذه التحديات من خلال حماية المعلومات الشخصية للعملاء مع السماح بالتحليلات والتنبؤات. تحدد الدراسة الموضحة في هذه المقالة المتطلبات الأساسية للأطر التوليدية لإنشاء بيانات مالية تركيبية وتؤكد على فوائد توليد البيانات التركيبية. علاوة على ذلك ، تستكشف المقالة التقنيات والأساليب المختلفة المستخدمة لإنشاء وتقييم البيانات المالية التركيبية ، مثل أساليب التعلم الآلي الخاضعة للإشراف وغير الخاضعة للإشراف. استخدام البيانات التركيبية في التمويل لديه القدرة على إحداث ثورة في الصناعة وتسهيل البحث والتطوير مع الاستمرار في إعطاء الأولوية لخصوصية العميل.