Open AI از سیستم جدید هوش مصنوعی برای تبدیل متن به تصویر استفاده می کند

انتشار: 23 فروردین 1401
کد خبر: 223010123-155

از ابزار هوش مصنوعی جدیدی رونمایی کرده است که می‌تواند متن را به تصویر تبدیل کند؛ ابزاری که با نتایج خیره کننده قادر است آینده هنر در هوش مصنوعی را رقم بزند.
این سیستم که DALL-E 2 نام دارد، جانشین مدلی است که سال گذشته رونمایی شد. هرچند نسخه قبلی آن خروجی‌های چشمگیری داشت، اما نسخه جدید به نسبت قبل یک پیشرفت بزرگ است!DALL-E-2  درک متنی پیشرفته، تولید تصویر سریع‌تر و وضوح چهار برابر بیشتر را به این فناوری اضافه می‌کند.
ابزار جدید همچنین دو قابلیت اضافی را معرفی می‌کند: تداخل مجدد تصاویر موجود و یک ویژگی ویرایش به نام  Inpainting.
Inpainting ابزار  با تجزیه و تحلیل یک عنوان در زبان طبیعی، تصویر موجود را ویرایش می‌کند. این ویژگی می‌تواند اجزایی را به تصویر اضافه یا از آن حذف و در عین حال، تغییرات مورد نظر را در سایه‌ها، بازتاب‌ها و بافت‌ها یکپارچه‌سازی کند.
DALL-E 2در واقع  بر اساس تصاویر و زیرنویس‌های مربوط به آن‌ها آموزش داده شده سبب می‌شود این ابزار روابط بین تصاویر و کلمات را بشناسد. پس از آن، تصاویر جدید از طریق فرآیندی به نام Diffusion (انتشار) تولید می‌شوند. این فرآیند با الگویی از نقاط تصادفی شروع می‌شود. سپس سیستم زمانی که جنبه‌های خاصی از آن تصویر را تشخیص می‌دهد، به تدریج الگو را به تصویر تبدیل می‌کند.
برخی از ساخته‌های DALL-E 2 تقریباً بیش از حد واقعی به نظر می‌رسند. با این حال، محققان می‌گویند که این سیستم تمایل دارد برای اکثر عنوان‌هایی که افراد امتحان می‌کنند، تصاویر منطقی بصری ایجاد کند.
به طور کلی کاربردهای این ابزار زیاد است. طراحان گرافیک، توسعه‌دهندگان اپلیکیشن، رسانه‌ها، معماران، تصویرگران تجاری و طراحان محصول، همگی می‌توانند از این ابزار برای الهام گرفتن، خلاقیت‌های جدید و ویرایش استفاده کنند.