گوگل بهتازگی از هوش مصنوعی جدید خود به نام Whisk رونمایی کرده است که قادر به تولید تصاویر بدون نیاز به دستور متنی است. این تکنولوژی به کاربران این امکان را میدهد که به جای نوشتن توضیحات متنی، تصاویر مورد نظر خود را از طریق نمونههای تصویری وارد کنند و Whisk بر اساس آنها تصویر جدیدی تولید کند.
Whisk یکی از جدیدترین دستاوردهای آزمایشگاه هوش مصنوعی گوگل است و برخلاف سایر مدلهای موجود در بازار که به پرامپتهای متنی برای تولید تصویر وابسته هستند، از تصاویر بهعنوان ورودی استفاده میکند. به این ترتیب، کاربران میتوانند تصاویری مشابه با آنچه که در ذهن دارند، به سیستم بدهند و هوش مصنوعی خروجی متناسب را ایجاد کند. همچنین اگر کاربر تصویر خاصی در نظر نداشته باشد، میتواند با کلیک بر روی آیکون طاس، از تصاویر موجود در مجموعههای هوش مصنوعی گوگل بهرهبرداری کند.
با این حال، کاربران همچنان میتوانند از روش سنتی و دستور متنی برای تولید تصویر استفاده کنند و در صورت نیاز به تغییرات جزئی در تصویر، از ویرایشهای متنی بهرهبرند. در نهایت، تصویر تولید شده همراه با دستور متنی به کاربر تحویل داده میشود و آنها میتوانند آن را دانلود یا ویرایش کنند.
گوگل در توضیحات خود اعلام کرده است که هدف اصلی از طراحی Whisk، ارائه یک تجربه کاوش بصری سریع است، نه ویرایشهای پیشرفته. همچنین این شرکت تأکید کرده که ممکن است این سرویس در برخی موارد دچار خطا در پیادهسازی دستورات کاربران شود، بنابراین به کاربران این امکان داده شده تا پرامپتهای خود را ویرایش کنند.
برای توسعه این سرویس، گوگل از مدل تصویرساز “Imagen 3” بهره برده است و همچنین از هوش مصنوعی جدید دیگری به نام “Veo 2” برای تولید ویدیوها رونمایی کرده است. این مدل جدید قادر به درک زبان منحصربهفرد سینماتوگرافی است.
کدخبر ۲۱۲۰۳۰۹۲۷.۵۶۹