الأخبار التكنولوجية والاستعراضات والنصائح!

كيف تحلل واجهات برمجة تطبيقات Cloud Vision من Google عقدًا من الأخبار التلفزيونية ونصف مليار صورة

ستساعدك المقالة التالية: كيف تحلل واجهات برمجة تطبيقات Cloud Vision من Google عقدًا من الأخبار التلفزيونية ونصف مليار صورة

مع Kalev Leetaru ، رائد أعمال الإنترنت وقائد الفكر العالمي ، تمحور هذا الحديث عن Computer Vision DevCon 2020 ، حول مشروع GDELT للبيانات المفتوحة الذي استفاد من واجهات برمجة تطبيقات الرؤية والفيديو من Google لتحليل أكثر من نصف مليار صورة إخبارية وعقد من الأخبار التلفزيونية. في هذا الحديث ، يشرح كاليف ليتارو كيف يبدو تحليل تصور الصور للأخبار من خلال عيون الذكاء الاصطناعي السحابي وكيف يمكن للمرء أن يحول عشرات التيرابايت الناتجة من التعليقات التوضيحية لـ JSON إلى رؤى قابلة للتنفيذ؟

يبدأ الحديث بفكرة أخذ معلومات العالم المفتوحة. لذا يتحدث المتحدث بشكل أساسي عن الوصول إلى جميع أنحاء العالم وحول جمع معلومات العالم كبيانات ، والاستفادة منها لفهم العالم العالمي – من الأحداث والسرد إلى المشاعر – بشكل أساسي لبناء فهرس للمجتمع البشري؟

مشروع GDELT

لذلك ، وفقًا للمتحدث – Kalev Leetaru ، يحتوي مشروع GDELT على العديد من القطع المختلفة. مع كون أحدها هو التكنولوجيا ، حيث يجمع المشروع جميع البيانات من جميع أنحاء العالم ، ويتصفح كل مقال إخباري. استخدم كاليف هنا تقنيات عصبية إحصائية لقراءة مقالة إخبارية بشكل أساسي واستخراج المعلومات الواقعية من تلك المقالة.

مثال على ذلك – مع مثال على النص ، تأخذ Cloud Vision API تلك الجملة وتوزع المعنى وتحولها إلى رمز فعلي ، يمكن تمثيله وتحليله. لا تصل واجهة برمجة التطبيقات للأحداث المادية الموضحة في الأخبار فحسب ، بل تتجاوز ذلك أيضًا يمكنها التقاط السرد داخلها. بهذه الطريقة ، يسمح لنا برسم خريطة للعواطف حول العالم – السعادة من خلال عيون وسائل الإعلام. المشروع – GDELT – هو مشروع بيانات مفتوحة ، تدعمه Alphabet و Jigsaw بالإضافة إلى Google Cloud.

كيف يعمل وحالات الاستخدام

وفقًا للمتحدث ، يبدأ كل شيء بالأخبار ، وقد استقطبت GDELT وسائل الإعلام الإخبارية من أو حول السنوات الثلاث الماضية ، في محاولة للوصول إلى جميع أنحاء الكوكب ، ومراقبة وسائل الإعلام في الوقت الفعلي بشكل أساسي حول العالم. أيضًا ، حاليًا ، GDLET عبارة عن آلة تترجم 65 لغة وتستخدم هذا الكتالوج في الواقع لمعالجة كل هذا المحتوى المختلف. وهذا بدوره يؤدي إلى مجموعات بيانات مختلفة متعددة. تستخدم GDELT أيضًا أدوات GCP المتنوعة لمحاولة تقييم هذا المحتوى في جميع أنحاء العالم.

وأوضح كاليف أنه منذ عام 2016 ، أخذنا كل مقال إخباري واستخرجنا المعلومات ، وتخلصنا من الإعلانات وركزنا على الجزء الفعلي من المقال نفسه. نقوم ببعض المعالجة الأولية باستخدام المدرج التكراري التقليدي مثل تجزئة الإدراك الحسي ، متبوعًا ببعض التصفية الأساسية لتحديد ما إذا كانت الصورة كبيرة بدرجة كافية أو بدقة كافية. كما أنه يحدد ما إذا كانت الصورة تستحق المعالجة؟ “

قال كاليف: “من هذا المنطلق ، ننتهي بحوالي مليون صورة يوميًا نعرضها من خلال أداة Cloud Vision من Google وننتج شيئًا نسميه الرسم البياني المعرفي العالمي المرئي”. منذ عام 2016 ، عالجت GDELT حوالي مليون صورة إخبارية من جميع أنحاء العالم.

مع هذه المزايا ، يمكن استخدام GDELT للبحث عن الاحتجاجات التي تظهر تغير المناخ أو الدببة القطبية في وسائل الإعلام الجديدة. مثال على ذلك – إذا تم تحقيق صورة تدعي أن هناك احتجاجًا يحدث الآن في إيران خلال الدقائق العشر الماضية. حسنًا ، باستخدام التعرف البصري على الأحرف ، يمكن التحقق مما إذا كانت خلفية تلك الصورة فارسية أم عربية مصرية. وبالتالي ، فقط من خلال التعرف البصري على الأحرف (OCR) ، يمكن التشكيك في موثوقية الصور ، مما يقلل من الأخبار المزيفة.

باستخدام ميزات الخبرة ، يمكن التقاط صورة عشوائية من الوسائط الجديدة ، ويمكن لـ OCR معرفة ما إذا كان من المحتمل أن تصور الصورة ما تدعي أنه ببساطة من خلال النظر إلى خصائصها المختلفة.

الرسم البياني المعرفي المرئي

  • من عام 2016 إلى الوقت الحاضر ، تم وضع تعليقات توضيحية على 500 مليون صورة إخبارية في جميع أنحاء العالم من خلال Cloud Vision من Google بإجمالي ربع تريليون بكسل يتم تحديثها كل 15 دقيقة.
  • الملصقات (الكائنات + الأنشطة) ، التعرف الضوئي على الحروف ، الجغرافيا ، مشاعر الوجه ، EXIF ​​، والبحث العكسي عن الصور هي الخصائص التي تحدد رسم الخرائط.
  • يمكن استخدامه للبحث عن صور الاحتجاجات بعلامات “تغير المناخ”.
  • يمكن استخدامه للدببة القطبية مقابل الصحاري كتعبير مناخي.
  • يمكن أيضًا التحقق من الصور من خلال البحث العكسي عن الصور والتسميات التوضيحية وكذلك اللغة في الخلفية.