الأخبار التكنولوجية والاستعراضات والنصائح!

منظمة العفو الدولية للثبات تطلق الإصدار التجريبي من SDXL (الانتشار المستقر XL)

ستساعدك المقالة التالية: منظمة العفو الدولية للثبات تطلق الإصدار التجريبي من SDXL (الانتشار المستقر XL)

الإصدار التجريبي من أحدث طراز لـ Stability AI ، SDXL ، متاح الآن للمعاينة (Stable Diffusion XL Beta). كان بإمكانهم تزويدنا بمزيد من المعلومات حول النموذج ، لكن أي شخص يريد تجربته. نموذج جديد تمامًا يسمى SDXL هو الآن في مرحلة التدريب. من غير المعروف ما إذا كان سيُطلق عليها اسم نموذج SDXL عند نشره ، ولا يزال بعيدًا عن الاكتمال. لا يمكن إلا أن نفترض أنه نموذج أكثر تعقيدًا مع المزيد من المعلمات والتحسينات الأخرى. رقم الإصدار هو 2 ، وليس 3. ومن الممكن أن تؤدي تغييرات نموذج الإصدار 2 إلى زيادة أداء النظام ، ولكن من الأسهل معرفة مقدار ما إذا كان المرء يعرف المزيد. من المفيد أيضًا معرفة المعلمات التي تم تعديلها أو إضافتها في هذا الإصدار.

يمكن العثور على نموذج SDXL في DreamStudio ، مولد الصور الرسمي لـ Stability AI. يستخدم خوارزميات متطورة وطرق تعلم عميقة لإنشاء صور لافتة للنظر ومناسبة تمامًا للخدمات المختلفة. انتقل إلى القائمة المنسدلة للطراز واختر SDXL Beta لتجربته.

نموذج SDXL: كيفية استخدامه

DreamStudio، صانع الصور الرسمي لـ Stability AI ، يعرض الآن نموذج SDXL. يمكن الوصول إلى طراز SDXL عبر قائمة الطراز ؛ اختر SDXL Beta.

تحسينات

نص مقروء

تبرز قدرة SDXL على إنشاء نص مقروء بشكل أكبر لأنه لم يكن ممكنًا مع الإصدارات السابقة v1 و v2.1. كما هو موضح في نص الانتشار المستقر أدناه ، فإن النص الذي تم إنشاؤه بواسطة SDXL يكون دقيقًا في بعض الأحيان فقط. ومع ذلك ، فهو أفضل بكثير من الإصدار 2.1 والإصدار 1. وبسبب خوارزمية التعلم العميق المتفوقة ، يمكن لـ SDXLs فهم وإنتاج تركيبات لغوية أكثر تعقيدًا. لديها القدرة على أن تصبح أكثر دقة وجديرة بالثقة مع التطوير المستمر.

علم التشريح البشري

لطالما كافح انتشار الصوت مع إنشاء نماذج بشرية واقعية تشريحية بدقة. ليس من غير المألوف رؤية الأشخاص الذين يعانون من أطراف مفقودة أو زائدة. تشمل طرق الإصلاح الشائعة الرسم الداخلي ، ومؤخراً ، القدرة على نسخ وضعية من صورة مرجعية باستخدام إمكانية الوضع المفتوح في ControlNet. حقق نموذج SDXL Beta خطوات كبيرة في إعادة إنشاء المواقف بشكل صحيح من الصور الفوتوغرافية وقد تم استخدامه في العديد من المجالات ، بما في ذلك الرسوم المتحركة والواقع الافتراضي.

نمط بورتريه

يعد SDXL Beta تحسينًا مقارنة بالإصدار 1.5 ، حيث يتم إنشاء صور شخصية تظهر مثل الصور الفوتوغرافية. يتم تحقيق مظهر أكثر واقعية وطبيعية في الصور باستخدام الخوارزمية المحدثة الموجودة في SDXL Beta. يمكن تعديل مستويات الحدة والتشبع من قبل المستخدم للحصول على نتائج مخصصة.

ديوتون

مع الإصدار v1.5 ، يُنشئ المصطلح duotone دائمًا صورًا أحادية اللون. لكن SDXL Beta ينتج الآن صورًا ثنائية اللون بألوان قوس قزح. أدى التفسير السريع المحسن لنماذج V2 إلى ردود أكثر دقة وذات صلة ، مما يجعلها أداة أكثر موثوقية لتطبيقات البرمجة اللغوية العصبية.

الأساليب الفنية

كانت هناك تعديلات طفيفة ، ولكن نظرًا لأن النموذج الجديد مختلف ، فمن الصعب تحديد ما إذا كانت النتائج أفضل أم لا. ليس من السهل إصدار حكم حازم على جودة هذه التعديلات لأنها يمكن أن تكون مسألة اختيار شخصي أو رأي شخصي. ومع ذلك ، يمكن أن تكون الطبيعة الجديدة للتغييرات مثيرة للاهتمام وتحتاج إلى مزيد من التحقيق.

المزايا والنتائج

  • قد ينتج عن انتشار الصوت الآن نص يبدو منطقيًا.
  • بالمقارنة مع v2.1 و (بدرجة أقل) إصدارات v1.5 ، فإن الصور التي تنتجها SDXL أكثر جاذبية للعين.
  • يولد النموذج الجديد صورًا أكثر دقة.
  • تقدم جسم الإنسان.
  • على عكس الإصدار 2.1 ، أصبحت المطالبات السلبية اختيارية الآن.
  • يمكنه عمل صور شخصية نابضة بالحياة.
  • سيقوم الباحثون بالتخلص من بعض مكامن الخلل في النموذج قبل إطلاقه.

دلائل الميزات

  • استخدم txt2img لتحويل التفسيرات المكتوبة إلى صور مذهلة.
  • يمكن للمرء أن يأخذ صوره إلى المستوى التالي باستخدام img2img.
  • مع نماذج inpainting ، قد يختار المرء تركيب أجزاء جديدة من الصورة.
  • طلب الصور بكميات كبيرة: اصنع مجموعة من الصور دفعة واحدة.
  • ترقية ESRGAN x2Plus: الآن مع ضعف الدقة (جربها باستخدام img2img).
  • دعم المخططات X و Y و Z ، مما يسمح بإجراء مقارنات مرئية للمدخلات والنتائج.

محددات

  • من الممكن عدم التوافق مع الوظائف الإضافية الأخرى. قبل الإبلاغ عن مشكلة ، يجب على المرء أن يفكر في إزالة أي مكونات إضافية أخرى.
  • عشر دفعات هو الحد الأقصى المسموح به.
  • لا تدعم كل أجهزة أخذ العينات توجيه القصاصة.