الأخبار التكنولوجية والاستعراضات والنصائح!

مفتاح فصل كائن الصورة – نحو الذكاء الاصطناعي

ستساعدك المقالة التالية: مفتاح فصل كائن الصورة – نحو الذكاء الاصطناعي

نُشر في الأصل في Towards AI.

لقد جربت مؤخرًا تطبيقًا لتحرير الصور يضيف خلفيات مخصصة لصورتي. لذلك قمت بتحميل صورة لي وأنا أقف في منزلي وقمت بتطبيق خلفية على الشاطئ بحيث تبدو الصورة الناتجة وكأنني أقف على الشاطئ. ولكن عندما قمت بتحميل صورتي ، كيف فهم البرنامج أي أجزاء من الصورة كنت أنا وما هو جزء الصورة؟

حسنًا ، هذا هو المكان الذي يلعب فيه تجزئة الصور. تجزئة الصورة هي مهمة البحث عن وحدات البكسل التي تتوافق معًا في الصورة. هذه التقنية مفيدة لتحديد الكائنات الموجودة في الصورة بشكل منفصل. هنا يمكننا أن نتعرف على كيفية مساعدة Geodesic Active Contour في تقسيم الصورة إلى كائنات حتى لو لم تكن الحدود محددة جيدًا.

Active Contours هي خوارزميات ذكية يمكن استخدامها لإيجاد تقسيم الكائنات بدقة حتى في وجود ضوضاء أو تباين منخفض. الكفاف هنا يعني الخطوط العريضة للكائنات في الصورة. إنها تمثل الحدود التي تحيط بكائن في صورة ما. تبدأ خوارزميات الكنتور النشطة بمنحنى أولي يمكن تشويهه أو تعديله أثناء عملية التجزئة. تحلل الخوارزمية ميزات الصورة مثل النسيج والحواف وما إلى ذلك لتحديد حدود الكائن. تتطور المعالم النشطة ديناميكيًا ، وتعديل شكلها وموضعها بناءً على ميزات الكائن المستهدف.

هناك عدة خوارزميات كفاف نشطة. هنا سنرى Geodesic Active Contour ، والذي يستخدم صيغة مجموعة المستوى لتطوير المحيط.

الخطوات العامة في تجزئة الصورة باستخدام المعالم الجيوديسية النشطة هي كما يلي:

تهيئة الخطوط
بناءً على المعلومات (إن وجدت) التي لدينا بخصوص شكل وحجم وموقع الكائن في الصورة ، يمكننا تقدير منحنى أولي. يتم تعديل هذا المنحنى وتشويهه لاحقًا لتشكيل الحدود الفعلية. يمكن إغلاق الكنتور الأولي المحدد أو فتحه اعتمادًا على طبيعة الكائن الذي نريد اكتشافه.

تهيئة المستوى
في هذه الخطوة ، يتم تحويل الكفاف الأولي إلى تمثيل مجموعة المستوى. يشير تمثيل مجموعة المستوى إلى تعيين قيم إلى وحدات البكسل في الصورة بناءً على المحيط الأولي. سيكون للكفاف قيمة مستوى صفر. سيكون للبكسل داخل الكفاف قيمة موجبة بينما سيكون للبكسل خارج المحيط قيمة سالبة. تم العثور على القيمة باستخدام دالة تُعرف بوظيفة ضبط المستوى. حجم القيمة هو مسافة البكسل من المحيط. تعني المسافة هنا المسافة الإقليدية بين البكسل وأقرب نقطة في المحيط.

وظيفة الطاقة للخطوط
وظيفة الطاقة في الكفاف هي وظيفة رياضية تحدد جودة الكفاف المحدد. الطاقة الوظيفية هي مزيج من الطاقة الخارجية والداخلية. دعونا نلقي نظرة على كيفية حساب كل منهم.

الطاقة الداخلية هي الوظيفة التي تلتقط نعومة المحيط ، مما يمنع الإخراج من أن يكون مسننًا أو غير منتظم. لحساب الطاقة الداخلية القائمة على الانحناء ، يتعين علينا تصميم وظيفة تعاقب الانحناء العالي. باستخدام تقنيات مختلفة ، يتم حساب قيمة الانحناء لكل نقطة وتلخيصها للحصول على قيمة الطاقة الداخلية. يمكن قياس انحناء نقطة ما باستخدام تقنيات هندسية مثل الهندسة التفاضلية ، وصيغة Frenet-Serret (التي تستخدم مشتقات المتجهات المماسية والعادية والثنائية) ، وما إلى ذلك ، أو باستخدام تقنيات التقريب العددي مثل تحريك المربعات الصغرى أو المنتهية. تقريب الفرق.

الطاقة الخارجية هي الوظيفة التي تجعل المحيط أقرب إلى حد الصورة الفعلي. يمكن حساب الطاقة الخارجية بناءً على تدرج الصورة ، والذي يعطي معلومات حول تباين الكثافة المحلية في الصورة. يتم حساب التدرج اللوني للصورة باستخدام مرشحات مثل مرشح سوبيل. يتم تطبيق المرشح على كل من المحور السيني والمحور الصادي. يمكن استخدام قيمة التدرج على طول كل محور لإيجاد مقدار التدرج في البكسل باستخدام هذه الصيغة

لكل نقطة بالقرب من نقاط الكنتور ، يتم العثور على قيمة التدرج ويتم تلخيصها للحصول على الطاقة الخارجية للمحيط.

بعد إيجاد قيم الطاقة الخارجية والداخلية ، يمكن حساب الطاقة الكلية للكفاف من المجموع المرجح للطاقات الداخلية والخارجية. يتم تحديد الأوزان بناءً على الأهمية النسبية لسلاسة ودقة ميزات الصورة. يمكن تعديل قيم الوزن وفقًا لمتطلبات مهمة التجزئة.

تطور الكنتور
الآن يتم تطوير الخطوط عن طريق تغيير تمثيل مجموعة المستوى بناءً على طاقة المحيط. نحن نستخدم الطرق العددية التي تقوم بتحديث تمثيل مجموعة المستوى بشكل متكرر وبالتالي تقليل وظيفة الطاقة. هنا يمكننا استخدام طريقة النطاق الضيق لتحديث مجموعة المستوى.

تحدد طريقة النطاق الضيق مجموعة فرعية من الصورة الكلية التي تتكون من الكفاف وطبقة ضيقة حول المحيط. تتم تهيئة النطاق الضيق من خلال تحديد العرض واختيار الكفاف والنقاط المجاورة له التي تقع داخل العرض المحدد. نحن الآن نكرر كل نقطة في النطاق. احسب المشتق الجزئي لوظيفة مجموعة المستوى عند كل بكسل. يمكن حساب المشتقات الجزئية في كل نقطة باستخدام تقريب الفروق المحدودة. يمكننا الآن اشتقاق معادلة التطور من المشتقات. تُشتق معادلة التطور بطريقة تقلل من وظيفة الطاقة. يجب أن تكون معادلة التطور مزيجًا من مصطلح الطاقة الداخلية ومصطلح الطاقة الخارجي. باستخدام المعادلة ، يتم تحديث وظيفة ضبط المستوى بشكل متكرر.

يجب تحديث النطاق الضيق بعد كل تكرار للتأكد من أن الكفاف وجيرانه المباشرين لا يزالون في النطاق. سيتم تنفيذ التكرارات حتى يتقارب تمثيل مجموعة المستوى ، مما يعني أن الكفاف يلتقط الحدود الفعلية في الصورة. يجب استخراج الكفاف النهائي من تمثيل مجموعة المستوى عن طريق تحديد النقاط التي تكون فيها وظيفة ضبط المستوى لها قيمة قريبة من الصفر. يمكننا الحصول على كفاف سلس ومستمر من هذه النقاط عن طريق الاستيفاء. تمثل النقاط المتصلة الناتجة حدود الكائن المقسم.

تم النشر عبر نحو الذكاء الاصطناعي