هوش مصنوعی جدید گوگل با نام Whisk تصاویر را بدون نیاز به دستور متنی تولید می‌کند

انتشار: 27 آذر 1403

گوگل به‌تازگی از هوش مصنوعی جدید خود به نام Whisk رونمایی کرده است که قادر به تولید تصاویر بدون نیاز به دستور متنی است. این تکنولوژی به کاربران این امکان را می‌دهد که به جای نوشتن توضیحات متنی، تصاویر مورد نظر خود را از طریق نمونه‌های تصویری وارد کنند و Whisk بر اساس آن‌ها تصویر جدیدی تولید کند.

Whisk یکی از جدیدترین دستاوردهای آزمایشگاه هوش مصنوعی گوگل است و برخلاف سایر مدل‌های موجود در بازار که به پرامپت‌های متنی برای تولید تصویر وابسته هستند، از تصاویر به‌عنوان ورودی استفاده می‌کند. به این ترتیب، کاربران می‌توانند تصاویری مشابه با آنچه که در ذهن دارند، به سیستم بدهند و هوش مصنوعی خروجی متناسب را ایجاد کند. همچنین اگر کاربر تصویر خاصی در نظر نداشته باشد، می‌تواند با کلیک بر روی آیکون طاس، از تصاویر موجود در مجموعه‌های هوش مصنوعی گوگل بهره‌برداری کند.

با این حال، کاربران همچنان می‌توانند از روش سنتی و دستور متنی برای تولید تصویر استفاده کنند و در صورت نیاز به تغییرات جزئی در تصویر، از ویرایش‌های متنی بهره‌برند. در نهایت، تصویر تولید شده همراه با دستور متنی به کاربر تحویل داده می‌شود و آن‌ها می‌توانند آن را دانلود یا ویرایش کنند.

گوگل در توضیحات خود اعلام کرده است که هدف اصلی از طراحی Whisk، ارائه یک تجربه کاوش بصری سریع است، نه ویرایش‌های پیشرفته. همچنین این شرکت تأکید کرده که ممکن است این سرویس در برخی موارد دچار خطا در پیاده‌سازی دستورات کاربران شود، بنابراین به کاربران این امکان داده شده تا پرامپت‌های خود را ویرایش کنند.

برای توسعه این سرویس، گوگل از مدل تصویرساز “Imagen 3” بهره برده است و همچنین از هوش مصنوعی جدید دیگری به نام “Veo 2” برای تولید ویدیوها رونمایی کرده است. این مدل جدید قادر به درک زبان منحصربه‌فرد سینماتوگرافی است.

کدخبر ۲۱۲۰۳۰۹۲۷.۵۶۹