الأخبار التكنولوجية والاستعراضات والنصائح!

استخراج معرفات Aadhar باستخدام OpenCV و TensorFlow- سوشيل أوستوال ، رئيس علوم البيانات في Motilal Oswal Financial Services

ستساعدك المقالة التالية: استخراج معرفات Aadhar باستخدام OpenCV و TensorFlow- سوشيل أوستوال ، رئيس علوم البيانات في Motilal Oswal Financial Services

تم تقديم الحديث الثاني عن اليوم الأول “الاستخراج الآلي للمعرف من نسخة ممسوحة ضوئيًا من نموذج فتح الحساب” في مؤتمر Computer Vision لهذا العام ، CVDC 2020 من قبل Sushil Ostwal ، رئيس علوم البيانات / الذكاء الاصطناعي في Motilal Oswal Financial Services.

من المقرر أن يتم تنظيم CVDC 2020 في يومي 13 و 14 أغسطس ، بتنظيم من جمعية علماء البيانات (ADaSCi) ، الهيئة المهنية العالمية الأولى لمتخصصي علوم البيانات والتعلم الآلي.

بدأت أوستوال الحديث من خلال مناقشة كيف أن استخراج المعرف من lakhs للمستند الممسوح ضوئيًا يعد نشاطًا صعبًا ويستغرق وقتًا طويلاً. تنقسم الجلسة إلى جزأين.

في الجزء الأول ، غطى المتحدث الأساليب التي تم اتباعها لاستخراج الهوية (الصورة ، بطاقة PAN ، إثبات العنوان) من النسخة الممسوحة ضوئيًا من نموذج فتح الحساب المادي ، نهج رؤية الكمبيوتر المتبع لحل هذه المشكلة ، أتمتة استخراج الهوية ، نشر حل وكذلك التعلم من التنفيذ.

بينما غطى الجزء الثاني من الجلسة خطوات إخفاء رقم بطاقة اضر. كما ناقشت أسطول التفاصيل الفنية للمكتبات والحزم وخطوات بناء النماذج والتقنيات المستخدمة خلال الجلسة الأولى.

وأشار إلى حالات الاستخدام المختلفة المتعلقة باستخراج المعرف الآلي. هم

  • قد يكون استخراج المعرّف (صورة ، رقم التعريف الشخصي ، إثبات العنوان) من نسخة ممسوحة ضوئيًا من نموذج فتح الحساب أمرًا صعبًا. يتم تشغيل النموذج في مستند 80-100 صفحة. الهدف هنا هو استخراج المعرف من lakhs لملف pdf الممسوح ضوئيًا لفتح حساب الوساطة.
  • إخفاء أول 8 أرقام من aadhar.
  • يمكن أن تظهر بطاقة PAN وإثبات العنوان في أي مستند صفحة ، وتظهر الصورة في أول 15 صفحة من المستند.
  • يمكن أن يشتمل معرف إثبات العنوان على رخصة القيادة ، ومعرف الناخب ، ودفتر الحساب المصرفي ، وفاتورة الكهرباء ، وجواز السفر ، وفاتورة الهاتف ، وبطاقة aadhar.
  • يمكن أن تختلف جودة مستند المسح الضوئي من جيد إلى ضعيف
  • يمكن أن يكون الحل المتاح في السوق مكلفًا.

في حديثه عن المكتبات والتقنيات ، ذكر المتحدث عددًا من المكتبات التي يمكن استخدامها في النموذج. ومع ذلك ، فقد شدد بشكل أساسي على 4 مكتبات محددة تم استخدامها بشكل أساسي أثناء الاستخراج. المكتبات هي-

  • بيتسيراكت: تُستخدم هذه المكتبة لقراءة النص من الصور باستخدام OCR استنادًا إلى Tesseract.
  • CV2: هذه مكتبة OpenCV
  • TensorFlow: يُستخدم TensorFlow لتوفير مهام سير العمل لتطوير نماذج اكتشاف الكائنات وتدريبها.
  • ImageMagick: تُستخدم هذه المكتبة لتحرير الصور ، مثل الاقتصاص والإخفاء وما إلى ذلك.

ثم سار أوطال من خلال نهج الرؤية الحاسوبية الذي تم اتباعه لحل المشكلة. قدم شرحًا مفصلاً لكل عملية في النهج وعملهم. فيما يلي شرح موجز للطرق-

1 | استخراج الصور

تتضمن المعالجة المسبقة لاستخراج الصور تحديد المتغير الأولي ، وتحويل مستندات pdf إلى صور ، وتحويل الصور إلى درجات رمادية لقراءة أفضل ثم تحديد وظيفة استخراج الصورة من ملف الصورة.

الخطوات المدرجة هنا هي-

  • كرر خلال أول 15 صفحة من ملف pdf
  • تحديد كائن النموذج- Cascadeclassifier فتح السيرة الذاتية
  • معلمات النموذج- DiscoverMultiScale3. يتضمن هذا معلمات تشعبية مهمة مثل Scalefactor و minNeighbours و minsize و objectRejectLevels.
  • بناء النموذج – تصنيف كشف الوجه. يتضمن ذلك استخراج الوجه إذا كان الاحتمال أكبر من الحد الأدنى.
  • تكبير الوجه المستخرج للحصول على الصورة كاملة.

2 | استخراج العنوان

الخطوة الثانية هي استخراج العنوان ، حيث تتضمن المعالجة المسبقة إثبات العنوان مثل رخصة القيادة ، وجواز السفر ، وما إلى ذلك ، وتحويل الصور إلى تدرج رمادي ، وعتبة الصورة مثل العتبة التكيفية للحصول على نتائج أفضل للصور ، والقياس ، وتحويل الصور إلى وظيفة سلسلة ، وتحويل النص إلى أحرف صغيرة ومعالجة نوع قائمة الكلمات الرئيسية وقائمة الكلمات السلبية من أجل التصنيف الصحيح.

3 | استخراج PAN

الخطوة التالية هي استخراج PAN ، حيث تتضمن خطوات المعالجة المسبقة فحص حجم ملف الصورة ، وتحويل الصور إلى درجات رمادية ، وعتبة الصورة عن طريق تطبيق الحد العام ، وزيادة دقة الصورة عن طريق مضاعفة الطول والعرض ، وتحويل الصور إلى نصوص ، وتحويل النص إلى أحرف صغيرة ، وتحديد قائمة الكلمات الرئيسية لـ PAN ، وتدوير الصور بالإضافة إلى توسيع أبعاد الصورة لـ TensorFlow.

في هذه العملية ، يتم استخدام TensorFlow SSD Inception V2 ويتم استخدام النموذج المدرب أعلاه لاكتشاف PAN ، والذي وفقًا لـ Ostwal يُرجع احتمال وجود صورة PAN. وفقًا له ، إذا كان احتمال PAN أكبر من العتبة وتم اكتشاف وجه ، يتم استخراج PAN.

بهذا تنتهي الجلسة الأولى من الحديث. أما الجلسة الثانية وهي إخفاء رقم Aadhaar فتتضمن نموذجين وهما إخفاء رقم Aadhar في الصفحة وإخفاء رقم Aadhar في Aadhar. تتضمن المعالجة المسبقة لرقم Aadhar الخطوات التالية-

  • تحويل ملفات pdf إلى صور
  • اضبط دقة الصورة على 300 * 300
  • عتبة التكيف والتنعيم (Gaussian Blur) لنتائج أفضل
  • OCR لتحويل الصورة إلى نص وتحويل النص إلى أحرف صغيرة
  • تحديد قائمة الكلمات الأساسية Aadhar
  • تحديد أنماط regex لرقم Aadhar لاستخراج أول 8 أرقام
  • قم بتعيين أرقام الصفحات للتحقق من مستند بطاقة Aadhar
  • لكل نسخة من النموذج ، استخرج إحداثيات أول 8 أرقام من رقم Aadhar.

تعيين

صرح أوستوال أن النشر الكامل للنموذج استغرق حوالي شهرين من خلال تنفيذ مجموعات من 1000 صورة في 3 خوادم متطورة ، حيث كان لكل خادم 8 مثيلات من الخوارزمية تعمل بالتوازي.