الأخبار التكنولوجية والاستعراضات والنصائح!

يمكن أن تساعدنا الأوهام البصرية في بناء الجيل القادم من الذكاء الاصطناعي

ستساعدك المقالة التالية: يمكن أن تساعدنا الأوهام البصرية في بناء الجيل القادم من الذكاء الاصطناعي

تنظر إلى صورة دائرة سوداء على شبكة من النقاط الدائرية. إنها تشبه ثقبًا محترقًا في قطعة من مادة شبكية بيضاء ، على الرغم من أنها في الواقع صورة مسطحة وثابتة على شاشة أو قطعة من الورق. لكن عقلك لا يفهمها بهذه الطريقة. مثل بعض التجارب الهلوسة منخفضة المستوى ، فإن عقلك ينطلق ؛ إدراك الصورة الثابتة على أنها فم نفق أسود يتحرك نحوك.

استجابةً للإحتمال الحقيقي للتأثير ، يبدأ الجسم في الاستجابة دون وعي: تتسع حدقة العين للسماح بدخول المزيد من الضوء ، تمامًا كما لو كنت على وشك الانغماس في الظلام لضمان أفضل رؤية ممكنة.

تم إنشاء التأثير المعني بواسطة Akiyoshi Kitaoka ، عالم النفس في جامعة Ritsumeikan في كوبي ، اليابان. إنها واحدة من عشرات الأوهام البصرية التي ابتكرها على مدار حياته المهنية الطويلة. (قال ، “أنا أحبهم جميعًا” ، ردًا على سؤال Digital Trend حول ما إذا كان لديه مفضل.)

كان هذا الوهم الجديد موضوع بحث نُشر مؤخرًا في مجلة Frontiers in Human Neuroscience. في حين أن تركيز الورقة ينصب بشدة على الاستجابات الفسيولوجية البشرية للتأثير الجديد (الذي اتضح أن حوالي 86 بالمائة منا سيختبرونه) ، قد يكون للموضوع العام أيضًا أهمية كبيرة عندما يتعلق الأمر بمستقبل ذكاء الآلة – حيث كان أحد الباحثين حريصًا على الشرح لـ Digital Trends.

حافة تطورية

للوهلة الأولى ، قد يبدو كما لو أن هذه الصورة تظهر دوامة تتجه نحو المركز. لكن حاول اتباع أحد الخطوط لأنه يبدو منحنيًا للداخل ، وستدرك أنه ليس حلزونيًا على الإطلاق.

هناك خطأ ما في دماغك. على الأقل ، هذا استنتاج سهل يمكن استخلاصه من الطريقة التي يدرك بها الدماغ البشري الأوهام البصرية. ما التفسير الآخر للصورة الثابتة ثنائية الأبعاد التي يدركها الدماغ على أنها شيء مختلف تمامًا؟ لفترة طويلة ، كان علم النفس السائد يحسب ذلك بالضبط.

“في البداية اعتقد الناس ،” حسنًا ، دماغنا ليس مثاليًا … إنه لا يصح دائمًا. ” هذا فشل ، أليس كذلك؟ ” قال برونو لينج ، الأستاذ في قسم علم النفس بجامعة أوسلو والمؤلف الأول للدراسة المذكورة أعلاه. “كانت الأوهام في هذه الحالة مثيرة للاهتمام لأنها ستكشف عن نوع من النقص في الماكينة.”

ليس لدى الدماغ طريقة لمعرفة ما هو [really] في الخارج.”

لم يعد علماء النفس ينظرون إليهم بهذه الطريقة. إذا كان هناك أي شيء ، فإن البحث مثل هذا يسلط الضوء على كيف أن النظام المرئي ليس مجرد كاميرا مباشرة. يوضح الوهم البصري “الفتحة المتوسعة الخادعة” أن العين تتكيف مع الضوء والظلام المدرك ، وحتى المتخيل ، بدلاً من الطاقة المادية.

الأهم من ذلك ، أنه يُظهر أننا لا نسجل العالم بطريقة غبية باستخدام أنظمتنا البصرية ، ولكن بدلاً من ذلك نجري مجموعة مستمرة من التجارب العلمية من أجل اكتساب ميزة تطورية طفيفة. الهدف هو تحليل البيانات المقدمة إلينا ومحاولة التعامل مع المشكلات بشكل استباقي قبل أن تصبح ، حسنًا ، مشاكل.

“الدماغ ليس لديه طريقة لمعرفة ما هو [really] قال لينغ. “ما تفعله هو بناء نوع من الواقع الافتراضي لما يمكن أن يكون هناك. هناك القليل من التخمين. في هذا الصدد ، يمكنك التفكير في الدماغ كنوع من الآلة الاحتمالية. يمكنك تسميتها آلة بايزي إذا أردت. إنها تستخدم بعض الفرضيات السابقة وتحاول اختبارها طوال الوقت لمعرفة ما إذا كان ذلك يعمل “.

يعطي Laeng مثالاً على قيام أعيننا بإجراء تعديلات على أساس ليس أكثر من انطباع الضوء من الشمس: حتى عندما يتم رؤية ذلك من خلال الغطاء السحابي أو المظلة العلوية للأوراق. فقط في حالة.

“ما يهم في التطور ليس أنه صحيح [at that moment]ولكن هذا أمر محتمل. “من خلال تقييد التلميذ ، يتأقلم جسمك بالفعل مع موقف من المحتمل جدًا أن يحدث في فترة زمنية قصيرة. ما يحدث [if the sun suddenly comes out] هل أنت مبهور. مبهر يعني عاجز مؤقتا. هذا له عواقب وخيمة سواء كنت فريسة أو كنت مفترسا. تفقد جزءًا من الثانية في موقف معين وقد لا تنجو “.

لا يقتصر الأمر على الضوء والظلام حيث تحتاج أنظمتنا البصرية إلى التخمين أيضًا. فكر في لعبة تنس حيث تتحرك الكرة بسرعة عالية. إذا قمنا ببناء سلوكنا كليًا على ما يستقبله النظام البصري في أي لحظة معينة ، فسوف نتخلف عن الواقع ونفشل في إعادة الكرة. قال لينغ: “نحن قادرون على إدراك الحاضر على الرغم من أننا عالقون بالفعل في الماضي”. الطريقة الوحيدة للقيام بذلك هي من خلال التنبؤ بالمستقبل. تبدو وكأنها لعبة كلمات ، ولكن هذا باختصار “.

رؤية الآلة تتحسن

izusek / جيتي إيماجيس

إذن ما علاقة هذا برؤية الكمبيوتر؟ كل شيء محتمل. لكي يتمكن الروبوت ، على سبيل المثال ، من العمل بفعالية في العالم الحقيقي ، يجب أن يكون قادرًا على إجراء هذه الأنواع من التعديلات أثناء التنقل. تتمتع أجهزة الكمبيوتر بميزة عندما يتعلق الأمر بقدرتها على إجراء عمليات حسابية سريعة للغاية. ما لا يملكونه هو ملايين السنين من التطور إلى جانبهم.

في السنوات الأخيرة ، قطعت الرؤية الآلية خطوات هائلة. يمكنهم التعرف على الوجوه أو المشية في تدفقات الفيديو في الوقت الفعلي – وربما حتى في حشود كبيرة من الناس. يمكن لتصنيف الصور والأدوات التقنية المتشابهة التعرف على وجود كائنات أخرى أيضًا ، بينما تتيح اختراقات تجزئة الكائنات فهم محتوى المشاهد المختلفة بشكل أفضل. كما تم إحراز تقدم كبير عندما يتعلق الأمر باستقراء الصور ثلاثية الأبعاد من المشاهد ثنائية الأبعاد ، مما يسمح للآلات “بقراءة” المعلومات ثلاثية الأبعاد ، مثل العمق ، من المشاهد. هذا يجعل رؤية الكمبيوتر الحديثة أقرب إلى إدراك الصورة البشرية.

ومع ذلك ، لا تزال هناك فجوة بين أفضل خوارزميات الرؤية الآلية وأنواع القدرات القائمة على الرؤية التي يمكن للغالبية العظمى من البشر القيام بها منذ صغرهم. في حين أننا لا نستطيع أن نوضح بالضبط كيف نؤدي هذه المهام القائمة على الرؤية (على حد تعبير مايكل بولاني المجري البريطاني متعدد اللغات ، “يمكننا أن نعرف أكثر مما يمكننا أن نقول”) ، ومع ذلك فنحن قادرون على أداء مجموعة رائعة من المهام التي تسمح لنا بتسخير بصرنا بمجموعة متنوعة من الطرق الذكية.

اختبار تورينج لرؤية الآلة

إذا كان الباحثون والمهندسون يأملون في إنشاء أنظمة رؤية حاسوبية تعمل على الأقل على قدم المساواة مع مهارات المعالجة البصرية لدماغ البرمجيات الرطبة ، فإن بناء الخوارزميات التي يمكنها فهم الأوهام البصرية ليس نقطة انطلاق سيئة. على أقل تقدير ، يمكن أن تكون طريقة جيدة لقياس مدى جودة عمل أنظمة الرؤية الآلية لأدمغتنا. قد لا تكون الإجابة على الذكاء العام الاصطناعي الأسطوري ، ولكنها قد تكون المفتاح لفتح الرؤية العامة.

صدق أو لا تصدق ، لكن كل هذه الكرات هي نفس الظل الرمادي ، ويفسرها عقلك على أنها ذات ألوان مختلفة بناءً على الإشارات السياقية للخطوط الملونة التي تعبرها

“إذا طور شخص ما ، يومًا ما ، نظامًا بصريًا اصطناعيًا يرتكب نفس أخطاء الإدراك الوهمي التي نرتكبها ، فستعرف في هذه المرحلة أنهم [achieving] قال لينج: “محاكاة جيدة لكيفية عمل دماغنا”. “سيكون نوعًا من اختبار تورينج. إذا كانت لديك شبكة اصطناعية ينخدع بها الوهم كما نحن ، فنحن إذن [would be] قريب جدًا من فهم الحساب الأساسي للدماغ نفسه “.

يتفق Yi-Zhe Song ، قارئ الرؤية الحاسوبية والتعلم الآلي في مركز معالجة الكلام البصري والإشارات بجامعة سوري بالمملكة المتحدة ، مع هذه الفرضية. قال لـ Digital Trends: “إن مطالبة خوارزميات الرؤية بفهم الأوهام البصرية كموضوع عام له قيمة كبيرة للمجتمع”. “إنها تتجاوز التركيز الحالي للمجتمع المتمثل في مطالبة الآلات بذلك [recognize]، عن طريق دفع الظرف أبعد من ذلك [and] يطلب من الآلات التفكير. هذا الدفع [would represent] خطوة مهمة إلى الأمام نحو “الرؤية العامة” ، حيث يجب استيعاب التفسيرات الذاتية للمفاهيم المرئية “.

استخدم خيالك

حتى الآن ، كان هناك بعض البحث المحدود لتحقيق هذا الهدف – على الرغم من أنه لا يزال في مرحلة مبكرة نسبيًا. نسيم نعمة زاده باحث حاصل على دكتوراه. في نماذج الرؤية منخفضة المستوى في الذكاء الاصطناعي والروبوتات ، هو شخص واحد قام بنشر أعمال حول هذا الموضوع.

“نعتقد أن الاستكشاف الإضافي لدور النماذج الشبيهة بغوسيان البسيط في معالجة شبكية العين منخفضة المستوى ونواة غاوسي في مرحلة مبكرة [deep neural networks]، والتنبؤ بفقدان الوهم الإدراكي ، سيؤدي إلى تقنيات ونماذج رؤية حاسوبية أكثر دقة ، “قال نيماتزاده لـ Digital Trends. “[This could] المساهمة في نماذج عالية المستوى من العمق ومعالجة الحركة وتعميمها على فهم الكمبيوتر للصور الطبيعية “.

يضع ماكس ويليامز ، الباحث في الذكاء الاصطناعي الذي ساعد في تجميع مجموعة بيانات من آلاف صور الوهم البصري لأنظمة الرؤية الحاسوبية ، العلاقة بين الرؤية العامة والأوهام البصرية بإيجاز: “توجد الأوهام لأن أعيننا وأدمغتنا تؤدي دورًا فوضويًا ومخصصًا عملية لاستخراج مشهد مرئي من حقل ضوئي غير مفهوم بطريقة أخرى ، تم إنشاؤه بواسطة عالم مادي ونحن محصورون تمامًا تقريبًا “، كما أخبروا Digital Trends. “لا أعتقد أنه من الممكن أن نجعل نظامًا مرئيًا معبرًا بدرجة كافية ليتم اعتباره” إدراكًا “خالٍ أيضًا من الأوهام.”

تحقيق الرؤية العامة

لكي نكون واضحين ، فإن تحقيق رؤية عامة على المستوى البشري (أو أفضل) للذكاء الاصطناعي لن يؤدي ببساطة إلى تدريبهم على التعرف على الأوهام البصرية القياسية. لا توجد قدرة محددة للغاية ، على سبيل المثال ، لفك تشفير أوهام Magic Eye بدقة 99.9٪ في 0.001 ثانية ، ستحل محل ملايين السنين من التطور البشري.

(من المثير للاهتمام ، أن الرؤية الآلية لديها بالفعل نسختها الخاصة من الأوهام البصرية في شكل نماذج معادية ، والتي يمكن أن تجعلهم يخطئون – كما في أحد الرسوم التوضيحية المقلقة – لعبة سلحفاة مطبوعة ثلاثية الأبعاد لبندقية. ومع ذلك ، هذه لا تسفر عن نفس الفوائد التطورية مثل الخدع البصرية التي تعمل على البشر.)

ومع ذلك ، فإن جعل الآلات تفهم الأوهام البصرية البشرية ، والاستجابة لها بالطريقة التي نقوم بها ، قد يكون بحثًا مفيدًا للغاية.

وهناك شيء واحد مؤكد: عندما تحقق General Vision AI ، ستقع في نفس أنواع الأوهام البصرية كما نفعل نحن. على الأقل ، في حالة الحفرة الخادعة المتوسعة ، 86٪ منا.