ستساعدك المقالة التالية: جوجل، نيفين للرؤية والتعرف على الصور
جوجل، نيفين للرؤية والتعرف على الصور
استحوذت Google اليوم على لاعب رئيسي في مجال القياسات الحيوية للتعرف على الوجه والصور، Neven Vision. يبدو أن الفوائد والميزات الجديدة التي يمكن لشركة Google طرحها باستخدام Neven Vision تحت حزامها لا نهاية لها، وإذا كنت سأقارن فرصة الشراء الجديد من Google مع أي عملية استحواذ حديثة أخرى في تاريخ Google، فستكون فرصة Keyhole (على سبيل المثال Google). الأرض وخرائط جوجل).
أصدر أدريان جراهام، مدير منتجات بيكاسا، إعلانًا عن الاستحواذ على شركة Neven Vision على موقع مدونة جوجل : تأتي شركة Neven Vision إلى Google مزودة بتكنولوجيا وخبرة عميقة في مجال استخراج المعلومات تلقائيًا من الصورة. يمكن أن يكون الأمر بسيطًا مثل اكتشاف ما إذا كانت الصورة تحتوي على شخص ما أم لا، أو قد يكون معقدًا في يوم ما مثل التعرف على الأشخاص والأماكن والأشياء. قد تسهل عليك هذه التقنية تنظيم الصور التي تهمك والعثور عليها. ليس لدينا أي ميزات محددة لعرضها اليوم، ولكننا نتطلع إلى مشاركة المزيد معك قريبًا.
بالتأكيد؛ يمكن أن يؤدي التعرف على الصور والوجه والمكان والأشياء إلى تغيير تجربة تنظيم صور Google Picasa بالكامل، ومع وضع العلامات التلقائي، قد يصبح منافسًا خطيرًا لـ Yahoo’s Flickr أو Yahoo Photos.
ومع ذلك، هناك ما هو أكثر بكثير في عملية الاستحواذ هذه بخلاف تقنية وضع علامات على ألبوم الصور وتقنية تعريف الصورة.
براءات الاختراع والفيديو وتكنولوجيا الهاتف المحمول
دعونا أولاً نلقي نظرة على براءات الاختراع التي تمتلكها شركة Neven Vision. تمت إزالة موقع NevenVison.com وهو يقدم رسائل Google، ولكن لمحة عن صفحاته الموجودة مسبقًا في جوجل ذاكرة التخزين المؤقت كافئ القارئ ببعض المعلومات الأساسية الرائعة عن الشركة وبراءات اختراعها:
رقم براءة الاختراع ووصفها
* EP1072018: التقاط حركة الوجه على أساس المويجات للرسوم المتحركة للصورة الرمزية
* 1072014 التعرف على الوجوه من صور الفيديو
* EP1072018 التقاط حركة الوجه المستندة إلى المويجات للرسوم المتحركة الرمزية
* 218457 التعرف على الوجوه من صور الفيديو
* 218458 التقاط حركة الوجه على أساس المويجات للرسوم المتحركة الرمزية
* EP1072018 التقاط حركة الوجه المستندة إلى المويجات للرسوم المتحركة الرمزية
* 1072014 التعرف على الوجوه من صور الفيديو
* 6714661 طريقة ونظام لتخصيص تتبع ملامح الوجه باستخدام المعالم الدقيقة
* 6222939 مجموعة من الرسوم البيانية المعنونة لتحليل الصور (EYEM1160/ NE01)
* 6356659 مجموعة من الرسوم البيانية المعنونة لتحليل الصور
* 6563950 مجموعة من الرسوم البيانية المعنونة لتحليل الصور
* 6466695 إجراء التحليل التلقائي للصور وتسلسلات الصور بناءً على الأشكال الأولية ثنائية الأبعاد
* 6272231 التقاط حركة الوجه على أساس المويجات للرسوم المتحركة الرمزية
* 6580811 التقاط حركة الوجه على أساس المويجات للرسوم المتحركة الرمزية
* 6301370 التعرف على الوجوه من صور الفيديو
وكما نرى من قائمة براءات الاختراع، فإن Neven Vision لا يقتصر على التعرف على الوجه ولا التعرف على الصور من خلال الصور وحدها، بل يحمل مجموعة رائعة من براءات اختراع التعرف على الفيديو، والتي تتمحور تحديدًا حول التعرف على الوجه من صور الفيديو وتطبيق هذه التقنية على الهاتف المحمول.
تمامًا كما اعتقدت أن لدي نوعًا من السبق الصحفي لبراءة اختراع حول الشركة، قمت بالنقر فوق SEO بواسطة SEA ورأيت ذلك لقد قام بيل سلاوسكي بالفعل بإدراج براءات الاختراع هذه ومقتطفات من ملخصاتها. لذا، بدلاً من السير في نفس المسار، إليك بعض طلبات براءات الاختراع والملخصات المثيرة للاهتمام التي أبرزها السيد سلاوسكي:
نظام الاستعلام عن قاعدة الصور لمحركات البحث للهواتف المحمولة المزودة بكاميرا مدمجة
اخترعها هارتموت نيفين، الأب.
طلب براءة الاختراع الأمريكية 20050185060
تم النشر في 25 أغسطس 2005
تم الاسترجاع 20 فبراير، 2004
خلاصة
يتم تجهيز عدد متزايد من الهواتف المحمولة وأجهزة الكمبيوتر بكاميرات. وبالتالي، بدلاً من السلاسل النصية البسيطة، من الممكن أيضًا إرسال الصور كاستعلامات إلى محركات البحث أو قواعد البيانات. علاوة على ذلك، فإن التقدم في التعرف على الصور يسمح بدرجة أكبر من التعرف الآلي على الأشياء، أو سلاسل الحروف، أو الرموز في الصور الرقمية. وهذا يجعل من الممكن تحويل المعلومات الرسومية إلى تنسيق رمزي، على سبيل المثال، نص عادي، من أجل الوصول بعد ذلك إلى معلومات حول الكائن المعروض.
محرك بحث يعتمد على الصور للهواتف المحمولة المزودة بالكاميرا
اخترعها هارتموت نيفين، الأب وهارتموت نيفين
طلب براءة الاختراع الأمريكية رقم 20060012677
تم النشر في 19 يناير 2006
تم الاسترجاع في 13 مايو 2005
خلاصة
تم الكشف عن نظام استرجاع المعلومات المعتمد على الصور والذي يشتمل على هاتف محمول وخادم بعيد. يحتوي الهاتف المحمول على كاميرا مدمجة ووصلة اتصال لنقل الصورة من الكاميرا المدمجة إلى الخادم البعيد. يحتوي الخادم البعيد على محرك التعرف البصري على الأحرف لإنشاء قيمة ثقة أولى بناءً على صورة من الهاتف المحمول، ومحرك التعرف على الكائنات لإنشاء قيمة ثقة ثانية بناءً على صورة من الهاتف المحمول، ومحرك التعرف على الوجه لإنشاء قيمة ثقة ثانية تعتمد قيمة الثقة الثالثة على صورة من الهاتف المحمول، ووحدة متكاملة لتلقي قيم الثقة الأولى والثانية والثالثة وإنشاء مخرجات التعرف.
نظام وطريقة القياسات الحيوية المتعددة القائمة على صورة واحدة
اخترعها هارتويج آدم، هارتموت نيفين، ويوهانس ب. ستيفنز
طلب براءة الاختراع الأمريكية 20060050933
تم النشر في 9 مارس 2006
تم الاسترجاع 21 يونيو، 2005
خلاصة
يصف هذا الكشف طرق دمج التعرف على الوجه والجلد وقزحية العين لتوفير نظام بيومتري بمستوى غير مسبوق من الدقة لتحديد هوية الأفراد. ومن السمات الجذابة لهذا النهج أنه لا يتطلب سوى صورة رقمية واحدة تصور وجهًا بشريًا كبيانات مصدر.
إلى جانب براءات الاختراع وطلبات براءات الاختراع، ربما تكون الطريقة الأفضل للنظر في ما جلبته Google تحت جناحها هي النظر إلى المنتجات الملموسة والشركات والعملاء الذين يستخدمون تقنية Neven Vision.
الأول هو iScout، وهو منتج موجه للتسويق عبر الهاتف المحمول يسمح للمستخدمين بالتقاط صورة باستخدام كاميرا هواتفهم المحمولة ثم إرسال تلك الصورة إلى iScout لتلقي القسائم أو الدخول في المسابقات أو اليانصيب أو المشاركة في معاملات الهاتف المحمول (من البيان الصحفي الصادر في 6 أبريل):
بالنسبة للمسوقين، يمكن استخدام iScout لحملات التسويق عبر الهاتف المحمول القائمة على الصور (الشعارات، وتغليف المنتجات، وإعلانات المجلات والصحف، والملصقات، واللوحات الإعلانية، وما إلى ذلك). باستخدام iScout، لا يمكن لحملات التسويق عبر الهاتف المحمول عرض محتوى غني خاص بالعلامة التجارية قائم على الوسائط المتعددة (الصورة والنص والصوت وقريبًا الفيديو)، ولكن يمكن أيضًا تغيير المحتوى ديناميكيًا من خلال تفاعل المشترك. يمكن للمشتركين التفاعل مع صور العالم الحقيقي مثل إعلانات المجلات أو الصحف أو الملصقات أو عناصر البيع بالتجزئة وأي صورة تجارية أخرى يرونها من خلال التقاط الصور بهواتفهم المزودة بكاميرات وإرسالها للحصول على عروض تسويقية والدخول في المسابقات والمشاركة في المعاملات والبحث عن معلومة. يمكن تخصيص تجربة مستخدم الهاتف المحمول ديناميكيًا استنادًا إلى التفاعل والنية، مما يؤدي إلى إنشاء تجربة مستخدم فريدة وغنية بالمحتوى.
أجرت Neven Vision بحثًا مكثفًا لتحديد حل الهاتف المحمول لتلبية جميع متطلبات iScout. أثناء هذا البحث، اكتشفت Neven Vision حل النشر عبر الهاتف المحمول SmartPathTM من Trilibis Mobile. يمكّن SmartPath العملاء من إنشاء وإدارة تطبيقات الهاتف المحمول ذات المحتوى الغني والقابل للتخصيص بدرجة كبيرة لتشغيلها عبر جميع الأنظمة الأساسية والشبكات والأجهزة الرئيسية. باستخدام SmartPath، قدمت Neven Vision عددًا من التحسينات على iScout، بما في ذلك واجهة مستخدم أكثر سهولة، والقدرة على حفظ ملفات التنزيل وقائمة متعددة اللغات يمكن ترجمتها حسب البلد.
وقال أليكس كوري، الرئيس التنفيذي لشركة Neven Vision: “إن التسويق عبر الهاتف المحمول يستعد لتحقيق نمو مفرط، حيث تحقق الأسواق الآسيوية والأوروبية بالفعل إيرادات كبيرة من خدمات البيانات لمشغلي شبكات الهاتف المحمول”. “يجلب البحث المرئي عبر الهاتف المحمول عنصرًا حاسمًا إلى هذا السوق، تمامًا كما فعل البحث المدفوع بالنسبة للإنترنت. فهو يساعد المعلنين والعلامات التجارية على الانتقال من الإعلانات المستندة إلى مرات الظهور منخفضة الأداء إلى أساليب أكثر تفاعلية وفي الوقت الفعلي لإشراك المستهلكين، مما يوفر فرصة رائعة لبناء اتصال حقيقي في لحظة اهتمام المستهلك وإنشاء مسار مناسب للاستجابة المباشرة.
يبدو أن Google AdWords على الحافلات واللوحات الإعلانية وغيرها من أشكال الإعلان الخارجي لم يعد مجرد مزحة بين لاعبي Madison Avenue بعد الآن.
تخيل أن تقنية Google AdWords تراقب الملفات الشخصية للمستخدمين والمسارات التي يسلكونها عمومًا إلى مكان العمل، أو المطعم المفضل وقت الغداء، أو العودة إلى المنزل؛ ومن ثم تحسين الإعلانات الخارجية أو إعلانات مترو الأنفاق لعرض الإعلان الأكثر ملاءمة للمجموعة الأكثر صلة في الوقت الأكثر صلة.
التقط صورة لهذا الإعلان بهاتفك المحمول وادخل للفوز بمسابقة أو اشترك في مجلة أو قم بشراء هدية اللحظة الأخيرة لزوجتك باستخدام Mobile Google Checkout. هذه هي الحقيقة (المتكهنة) التي جلبتها Neven Vision إلى Google Plex.
والأفضل من ذلك، ماذا لو لم يكن هناك إعلان للتصوير؟ يمكن استخدام Neven Vision iScout لالتقاط صورة لكائن ما، والتعرف على تلك الصورة ومن ثم تقديم معلومات التسوق المقارنة عبر Froogle أو نتائج بحث الويب العادية أو بحث الصور.
على سبيل المثال، كنت أسير في الغابة ولاحظت أن قرادة قد زحفت إلى أعلى ساقي وعضتني. يمكنني استخدام هاتفي (أو كاميرا wi-fi في هذا الشأن بمجرد انتشار شبكة wi-fi) لالتقاط صورة لهذا العنكبوت النذل وعلاماته وتلوينه لمعرفة ما إذا كان هذا القراد يحمل مرض لايم. ويمكن استخدام نفس الطريقة للتعرف على الثعابين أو العناكب السامة والترياق أو العلاج وضيق الوقت للعثور على المستشفيات القريبة. الاحتمالات لا حصر لها.
التعرف على الوجه على الهاتف المحمول
يبدو أن منتج الخبز والزبدة الخاص بشركة Neven Vision هو منتجهم سريع التعرف على الوجه عبر الهاتف المحمول والمرخص خصيصًا لوكالات إنفاذ القانون. عدد 2005 من الولايات المتحدة الأمريكية اليوم يغطي التكنولوجيا الخاصة بهم لهذا السوق المتخصصة:
يبرز Neven Vision باعتباره المحرك الوحيد للتعرف على الوجه في السوق والذي يمكن تشغيله مباشرة على الأجهزة المحمولة مثل المساعدين الرقميين الشخصيين والهواتف اللاسلكية والمحطات الطرفية المتنقلة.
ستستخدم الشركة هذه الإمكانية في منتج جديد يسمى Mobile Identifier ومن المقرر طرحه في الأشهر المقبلة. موجه نحو تطبيق القانون، يتميز Mobile Identifier بقاعدة بيانات مدمجة ومحرك للتعرف على الصور. تكون النتائج فورية لأن الضباط لا يحتاجون إلى انتظار نقل البيانات عبر الاتصالات اللاسلكية.
وفقًا لليز غانيس من GigaOM، يتم حاليًا استخدام تقنية Neven Vision للهاتف المحمول من قبل شرطة لوس أنجلوس من أجل التعرف على أعضاء العصابة.
والسؤال هو: هل ستوفر Google تقنية التعرف على الوجه عبر الهاتف المحمول إلى سوقها الاستهلاكية؟ هل سيكون بمقدور المرء التقاط صورة لشخص ما في الحانة، والبحث عنه في Google، ثم يتمكن بعد ذلك من قراءة مدونة ذلك الشخص، أو ملفه الشخصي على موقع MySpace، أو عنوان منزله؟ من المحتمل أن يؤدي القيام بذلك إلى إثارة جميع أنواع الخلافات المتعلقة بالخصوصية، ولكن التكنولوجيا اللازمة للقيام بذلك أصبحت قاب قوسين أو أدنى (المزيد حول هذا أدناه).
فيما يتعلق بالتعرف على الوجه عبر الهاتف المحمول، ما سنراه على الأرجح هو أن Google تستفيد من هذه المعلومات الشخصية أكثر من المستخدم النهائي.
على سبيل المثال، ألتقط صورة لفتاة لطيفة، أو مجموعة من الأشخاص في الحانة. وماذا يعرف جوجل الآن عن هؤلاء الأشخاص؟
* ما هي الحانات أو المطاعم التي يترددون عليها؟
* أين موقع هذا الشريط؟
* سواء كانوا يفضلون البيرة أو النبيذ أو المشروبات الكحولية.
* ما نوع الملابس التي يشترونها ويرتدونها؟
* سواء كانوا يدخنون أم لا.
* هل يرتدون النظارات أم لا؟
* بمن هم مرتبطون في العالم الحقيقي وما هو هذا الارتباط؟
* في أي كلية التحقوا؟
* ما هي الفرق الرياضية التي يتابعونها؟
* ما هي كمية المكياج التي يضعونها عند الخروج؟
* سواء كانوا يستخدمون غسول التسمير أم لا.
* هل لديهم رأس كامل الشعر، أصلع أم أصلع؟
قم بالإشارة إلى معلومات التعرف على الصور هذه مع ما تعرفه Google بالفعل عن مستخدميها المسجلين وغير المسجلين، والآن لدينا كم هائل من المعلومات التسويقية في متناول أيدينا.
جوجل تبني قاعدة بيانات للتعرف على الوجه؟
السؤال التالي الواضح في المعادلة هو كيف يمكن لشركة Google أو Neven Vision أن تعرف من نحن في المقام الأول؟ حسنًا، إذا كان لديك سجل إجرامي أو تاريخ من الارتباط بالعصابات، أو إذا كانت ولايتك تبيع معلومات ترخيص إدارة المركبات بشكل علني، فمن المحتمل أنك موجود في قاعدة بيانات Neven Vision بالفعل.
ولكن، كيف يمكن لـ Google الحصول على الشكل الذي تبدو عليه وجوهنا؟ أحد الأسباب وراء استهداف Google (أو سبب الشائعات) لشركة ناشئة تدعى Riya هو قدرتها على وضع العلامات والقدرة على وضع علامات جماعية على الصور بناءً على الشخص الموجود فيها والموقع وما إلى ذلك.
ومع ذلك، كانت هناك نظرية حديثة مفادها أن Google تقوم ببناء قاعدة بيانات لميزات الوجه لأصحاب حسابات Google بمفردهم. إيونوت أليكس في مدونة نظام التشغيل جوجل لديه نظرية مفادها أنه عندما يقوم مستخدم GMail أو GTalk بتحميل صورته أو صورته الرمزية، فإن Google تربط اقتصاص صور الوجه مع هذا الشخص، وبحثه وسجل الويب، وحسابه:
يتيح لك Gmail إضافة صور لجهات الاتصال الخاصة بك. إذا قمت بتحميل صورة، فسوف يطلب منك Gmail اقتصاص الصورة لفصل وجه الشخص. لذا فإن Gmail لديه قاعدة بيانات لصور متعددة للعديد من الأشخاص… إنها طريقة سهلة جدًا للحصول على قاعدة بيانات للوجوه مفيدة للتعرف على الوجوه. تعد خوارزميات اكتشاف الوجوه والتعرف عليها جيدة، ولكنها ليست جيدة بما فيه الكفاية، وهذه طريقة رائعة لجوجل لتحسين خوارزميات الذكاء الاصطناعي الخاصة بها باستخدام البيانات التي تم الحصول عليها من مستخدميها.
استخدام آخر لقاعدة بيانات الصور المستخدمة للتعرف على الوجه؟ نشرنا مساء يوم الأحد قصة على Google Video وGoogle Personalization تصف الوثيقة التقنية حول استخدام معلومات الشبكة الاجتماعية لتخصيص محرك البحث (والإعلانات)، إليك تذكير:
صديقي بيل سلاوسكي طرح هذا الأمر أثناء عرضه التقديمي حول الخوارزميات في استراتيجيات محرك البحث. قام بيل بتوصيل الورقة البيضاء، خريطة الاهتمام: حصاد ملفات تعريف الشبكة الاجتماعية للتوصيات، إلى أحدث شراكة بين Google وMySpace.
ملخص الورقة هو كما يلي:
“بينما تستمر معظم أنظمة التوصية في جمع نماذج تفصيلية عن “مستخدميها” ضمن مجال التطبيق الخاص بها، فإنها، في معظمها، غافلة عن السياق الأكبر لحياة مستخدميها خارج التطبيق. ما الذي يشغفون به كأفراد، وكيف يعرّفون أنفسهم ثقافيًا؟ وبما أن أنظمة التوصية أصبحت أكثر أهمية في حياة الناس، فيجب علينا أن نبدأ في نمذجة الشخص، وليس المستخدم.
في هذه الورقة، نستكشف كيف يمكننا بناء نماذج للأشخاص خارج مجالات التطبيق الضيقة، من خلال التقاط الآثار التي يتركونها على الويب، واستنتاج اهتماماتهم اليومية من ذلك. على وجه الخصوص، في هذا العمل، قمنا بحصد 100000 ملف شخصي على الشبكات الاجتماعية، حيث يصف الأشخاص أنفسهم باستخدام مفردات غنية عن شغفهم واهتماماتهم. من خلال التحليل التلقائي لأنماط الارتباط بين الاهتمامات المختلفة والهويات الثقافية (مثل “Raver”، و”Dog Lover”، و”Intellectual”)، قمنا ببناء InterestMap، وهو عرض على نمط الشبكة لمساحة الاهتمامات والهويات المترابطة. ومن خلال التقييم والمناقشة، نقترح أن التوصيات المقدمة في مساحة الشبكة هذه ليست دقيقة فحسب، ولكنها أيضًا واضحة للغاية من الناحية البصرية – كل اهتمام وحيد يتم وضعه في سياق البيئة الثقافية الأكبر للشبكة التي تقع فيها.
مثال بيل لكيفية استخدام هذه المعلومات التي تم جمعها من الشبكات الاجتماعية هو إذا كان المستخدم:
* يسرد الموسيقيين المفضلين لديهم في حساب MySpace الخاص بهم مثل John Lee Hooker وMuddy Waters وBessie Smith
* يبحثون في جوجل عن “البلوز”
* يمكن لـ Google الآن تقديم نتائج بحث مخصصة مع جميع العروض الموجهة لموسيقى البلوز.
* إذا كان مستخدم آخر عضوًا في Brett Hull Fan Club وقام بإدراج لعبة الهوكي كهواية في ملفه الشخصي أثناء إقامته في سانت لويس؛ يمكن أن تقدم Google نتائج مخصصة تركز على فريق Blues Hockey.
* بالطبع، يمكن توسيع هذا التخصيص ليشمل إعلانات فيديو Google.
لذا، في محاولة لإنهاء هذه المراجعة للاستحواذ على Google Neven Vision، وأفكاري وإمكانيات تطبيق تقنية NV على جهود Google الحالية، أود أن أضيف أنه إذا كانت الشبكات الاجتماعية هي مستقبل الاتصال عبر الإنترنت وكانت Google هي المستقبل سيستخدمون معلومات الملف الشخصي على الشبكة الاجتماعية لتخصيص محركات البحث الخاصة بهم، ولكن ليس لديهم طريقة لتحديد مالك الملف الشخصي على بعض الشبكات الاجتماعية بسبب عدم وجود إعلانات في الشبكة أو عدم وجود شراكات مع Google، ما هو كائن واحد أو تحديد أكثر هل ينشر مستخدمو أو أعضاء الشبكات الاجتماعية والمدونات والمنتديات أن Google يمكنها استخدام Neven Vision للمساعدة في تحديد هذا المستخدم؟ .