ال أوبن إيه آي، شركة أبحاث ذكاء اصطناعي مقرها سان فرانسيسكو أسسها إيلون ماسك ، أنشأت برنامج ذكاء اصطناعي أطلق عليه اسم DALL-E ماذا او ما ينشئ صورًا من أوصاف النص. يستخدم البرنامج نسخة من 12 مليار معلمة من نموذج اللغة الانحدار الذاتي ويمكن عمليا إنشاء صور لأي شيء.
تسمى التكنولوجيا المستخدمة في DALL-E لتكون قادرة على فهم أشكال اللغة المحولات التوليدية مسبقة التدريب 3 (GPT-3)، تم تطويره أيضًا بواسطة OpenAI. من الوصف ، يقوم البرنامج بإنشاء الرسوم التوضيحية واللوحات والصور والعروض والرسومات – باختصار ، أي شيء يمكن التعرف عليه من خلال الكلمات. في مقال OpenAI على DALL-E ، على سبيل المثال ، لدينا “كرسي بذراعين على شكل أفوكادو” والذي أصبح فيما بعد عدة عروض مختلفة. عند إنتاج مئات أو آلاف النتائج لموجه معين ، ستكون العديد من النتائج جيدة ، ولكن أحيانًا بعضها … لن تكون “قابلة للتحديد” بشكل كبير.
تصف شركة OpenAI DALL-E بأنه “وحدة فك ترميز واحدة فقط محول يستقبل النص والصورة كتيار واحد من 1280 رمزًا – 256 للنص و 1024 لنفسه – ونماذجهم جميعًا بطريقة الانحدار التلقائي. […] يستخدم DALL-E القناع السببي الافتراضي للرموز المميزة للنص واهتمام ضئيل للرموز المميزة للصور ذات الصف أو العمود أو نمط الانتباه التلافيفي ، اعتمادًا على الطبقة“.
“لقد وجدنا أن [DALL-E] لديه مجموعة متنوعة من القدرات ، بما في ذلك إنشاء نسخ مجسمة من الحيوانات والكائنات ، والجمع بين المفاهيم غير ذات الصلة بطرق معقولة ، وتقديم النص وتطبيق التحولات على الصور الموجودة “. – أوبن إيه آي.
“لقد وجدنا أن [DALL-E] لديه مجموعة متنوعة من القدرات ، بما في ذلك إنشاء نسخ مجسمة من الحيوانات والكائنات ، والجمع بين المفاهيم غير ذات الصلة بطرق معقولة ، وتقديم النص وتطبيق التحولات على الصور الموجودة “. – أوبن إيه آي.
مثل DPreview يذكر أن ما يفعله DALL-E ليس جديدًا في حد ذاته ، ولكن برنامج OpenAI الجديد يعمل بنجاح كبير ويمكنه التعامل مع اختلافات المدخلات بنجاح متفاوت. بالطبع ، لن تتمتع الصورة التي تم إنشاؤها من حيوان بنفس الجودة أو الحدة مثل الصورة الأصلية التي تم التقاطها بواسطة كاميرا رقمية. بالإضافة إلى ذلك ، يمكن أن يصبح DALL-E “هشًا عندما يتعلق الأمر بإعادة كتابة الأسطورة في السيناريوهات الصعبة”.
“بخلاف محرك العرض ثلاثي الأبعاد الذي يجب تحديد إدخالاته بشكل لا لبس فيه وبتفاصيل كاملة ، غالبًا ما يكون DALL · E قادرًا على” ملء الفراغات “عندما تشير التسمية التوضيحية إلى أن الصورة يجب أن تحتوي على تفاصيل معينة غير مذكورة صراحة.” – أوبن إيه آي.
“بخلاف محرك العرض ثلاثي الأبعاد الذي يجب تحديد إدخالاته بشكل لا لبس فيه وبتفاصيل كاملة ، غالبًا ما يكون DALL · E قادرًا على” ملء الفراغات “عندما تشير التسمية التوضيحية إلى أن الصورة يجب أن تحتوي على تفاصيل معينة غير مذكورة صراحة.” – أوبن إيه آي.
وجدت شركة OpenAI أن “DALL-E قادر على تقديم نفس المشهد في مجموعة متنوعة من الأساليب ويمكنه تكييف الإضاءة والظلال والأجواء بناءً على الوقت من اليوم أو الموسم من العام” ، حتى عندما لا يتم تحديد هذه التفاصيل.
أدناه ، يمكنك التحقق من بعض المطالبات المستخدمة لتدريب DALL-E:
…..
هل تفكر في شراء منتج عبر الإنترنت؟ تعرف على ملحق Save the World Connected لـ Google Chrome. إنه مجاني ويقدم لك مقارنات الأسعار في المتاجر الرئيسية وكوبونات حتى تتمكن دائمًا من الشراء بأفضل سعر. التحميل الان.
عبر: DPreview