از ابزار هوش مصنوعی جدیدی رونمایی کرده است که میتواند متن را به تصویر تبدیل کند؛ ابزاری که با نتایج خیره کننده قادر است آینده هنر در هوش مصنوعی را رقم بزند.
این سیستم که DALL-E 2 نام دارد، جانشین مدلی است که سال گذشته رونمایی شد. هرچند نسخه قبلی آن خروجیهای چشمگیری داشت، اما نسخه جدید به نسبت قبل یک پیشرفت بزرگ است!DALL-E-2 درک متنی پیشرفته، تولید تصویر سریعتر و وضوح چهار برابر بیشتر را به این فناوری اضافه میکند.
ابزار جدید همچنین دو قابلیت اضافی را معرفی میکند: تداخل مجدد تصاویر موجود و یک ویژگی ویرایش به نام Inpainting.
Inpainting ابزار با تجزیه و تحلیل یک عنوان در زبان طبیعی، تصویر موجود را ویرایش میکند. این ویژگی میتواند اجزایی را به تصویر اضافه یا از آن حذف و در عین حال، تغییرات مورد نظر را در سایهها، بازتابها و بافتها یکپارچهسازی کند.
DALL-E 2در واقع بر اساس تصاویر و زیرنویسهای مربوط به آنها آموزش داده شده سبب میشود این ابزار روابط بین تصاویر و کلمات را بشناسد. پس از آن، تصاویر جدید از طریق فرآیندی به نام Diffusion (انتشار) تولید میشوند. این فرآیند با الگویی از نقاط تصادفی شروع میشود. سپس سیستم زمانی که جنبههای خاصی از آن تصویر را تشخیص میدهد، به تدریج الگو را به تصویر تبدیل میکند.
برخی از ساختههای DALL-E 2 تقریباً بیش از حد واقعی به نظر میرسند. با این حال، محققان میگویند که این سیستم تمایل دارد برای اکثر عنوانهایی که افراد امتحان میکنند، تصاویر منطقی بصری ایجاد کند.
به طور کلی کاربردهای این ابزار زیاد است. طراحان گرافیک، توسعهدهندگان اپلیکیشن، رسانهها، معماران، تصویرگران تجاری و طراحان محصول، همگی میتوانند از این ابزار برای الهام گرفتن، خلاقیتهای جدید و ویرایش استفاده کنند.