الأخبار التكنولوجية والاستعراضات والنصائح!

تلبية TextDeformer: إطار عمل AI لتشوه الشبكة ثلاثية الأبعاد الموجهة بالنص

ستساعدك المقالة التالية: تلبية TextDeformer: إطار عمل AI لتشوه الشبكة ثلاثية الأبعاد الموجهة بالنص

تعد الشبكات ثلاثية الأبعاد (3D) مكونًا أساسيًا لرسومات الكمبيوتر والنمذجة ثلاثية الأبعاد ولديها العديد من مجالات التطبيق ، بما في ذلك الهندسة المعمارية وتصميم السيارات وتطوير ألعاب الفيديو وإنتاج الأفلام. الشبكة عبارة عن تمثيل رقمي لكائن ثلاثي الأبعاد يتألف من مجموعة من الرؤوس والحواف والوجوه التي تحدد شكلها وبنيتها. تمثل الرؤوس النقاط في الفضاء حيث تلتقي الحواف ، بينما تحدد الوجوه سطح الكائن.

نظرًا لأن إنشاء شبكات ثلاثية الأبعاد يمثل تحديًا ، فعادة ما يتم تخصيصها للخبراء ذوي المهارات الفنية الخاصة. هذا يعني أن الشخص سيجد صعوبة في إنشاء شبكات ثلاثية الأبعاد من الصفر دون هذه المعرفة. يتيح الإنترنت العثور على مجموعات بيانات متنوعة بها كائنات ثلاثية الأبعاد صنعها فنانون رقميون. ومع ذلك ، عندما يكون التخصيص مطلوبًا (حتى في أضيق الحدود) ، تكون عملية التحرير شاقة مثل الإنشاء البسيط.

لهذا السبب ، فإن مشكلة تشويه الشبكات هي موضوع حظي بقدر كبير من الاهتمام في رسومات الحاسوب ومعالجة الهندسة. في العديد من تقنيات الذكاء الاصطناعي الحالية ، يمكن للمستخدم معالجة التشوهات من خلال مقابض التحكم ، مما يسمح بالتشوهات الخشنة منخفضة التردد التي تحافظ على التفاصيل. يشار إلى هذه عادةً باسم تشوهات الحفاظ على التفاصيل. ومع ذلك ، في النمذجة ثلاثية الأبعاد ، غالبًا ما يكون من الضروري دمج المعلومات الهندسية الدقيقة ، والتي قد تستغرق وقتًا طويلاً ومعقدة ، حتى بالنسبة للفنانين المهرة.

بهذا المعنى ، تم اقتراح نهج جديد للذكاء الاصطناعي ، يسمى TextDeformer ، لأتمتة عملية تشوه الشبكات ثلاثية الأبعاد. يهدف TextDeformer إلى تحويل شكل مصدر معين إلى الشكل المستهدف المطلوب مع الحفاظ على الاتساق الدلالي بين الاثنين. فيما يلي نظرة عامة على سير عمل النظام وبنيته.

يعتمد هذا النهج على نجاح التقنيات التوليدية الحديثة الموجهة بالنص و NeRFs (حقول الإشعاع العصبي) ولكنها لا تتطلب بيانات تدريب ثلاثية الأبعاد. بدلاً من ذلك ، يستخدم المؤلفون عرضًا قابلًا للتفاضل مع برامج تشفير الصور المدربة مسبقًا مثل CLIP لضبط هندسة الكائنات المعروضة وتحسينها.

بعد التشوه ، يتم الحفاظ على بنية وخصائص شبكة المصدر ، وتلتزم الهندسة الناتجة بمواصفات النص. يختلف هذا العمل عن السابق في نوع المهمة التي يؤديها النموذج. بخلاف الأعمال السابقة الموجهة بالنص والتي تولد الهندسة من البداية أو تضيف التفاصيل مع الحفاظ على هندسة شبكة الإدخال ، يركز TextDeformer على مهمة التشويه.

بالتفصيل ، تم تصميم إطار العمل هذا لتعديل شكل إدخال موجود لإنشاء هندسة عالية الجودة تعكس بدقة شبكة المصدر. بالإضافة إلى ذلك ، يمكن أن ينتج عنه تغييرات في الشكل منخفضة التردد وتفاصيل عالية التردد ، مثل إطالة رقبة البقرة عند تشويهها إلى زرافة أو إضافة المقاييس عند تشويهها إلى تمساح. يصر المؤلفون على أن المراسلات الناتجة من شكل المصدر إلى الهدف مستمرة وذات مغزى (على سبيل المثال ، “تشوه الساق إلى الساق”) من خلال تلوين شبكة المصدر ، والتي تكون مرئية خلال التصورات.

بعض الأمثلة على النتائج التي تم إنتاجها والتي أبلغ عنها مؤلفو هذا العمل موضحة في الشكل أدناه. علاوة على ذلك ، يتضمن هذا الشكل مقارنة بين TextDeformer وأحدث DreamFusion.

كان هذا هو ملخص TextDeformer ، وهو إطار جديد للذكاء الاصطناعي لتمكين تشوه شبكة ثلاثية الأبعاد دقيقة موجهة بالنصوص. إذا كنت مهتمًا ، يمكنك معرفة المزيد حول هذه التقنية في الروابط أدناه.