گوگل با معرفی دو مدل جدید هوش مصنوعی، قابلیتهای خود در زمینه تولید محتوای تصویری و ویدیویی را گسترش داد. این شرکت از مدل Nano Banana 2 Lite برای تولید سریع تصاویر و همچنین نسخه عمومی Gemini Omni Flash برای ساخت و ویرایش ویدیو رونمایی کرده است.
مدل Nano Banana 2 Lite برای پروژههایی طراحی شده که به تولید تعداد زیادی تصویر در کمترین زمان نیاز دارند. به گفته گوگل، این مدل میتواند تنها در حدود ۴ ثانیه تصاویر باکیفیت تولید کند و در عین حال هزینه بسیار پایینی دارد؛ بهطوریکه تولید هر هزار تصویر تنها ۰.۰۳۴ دلار هزینه خواهد داشت. گوگل این نسخه را جایگزین مدل قبلی Nano Banana معرفی کرده و توسعهدهندگان را به مهاجرت به آن تشویق کرده است.
در کنار آن، Gemini Omni Flash نیز اکنون بهصورت گسترده در دسترس کاربران قرار گرفته است. این مدل امکان تولید و ویرایش ویدیو با استفاده از دستورات متنی را فراهم میکند؛ به این معنا که کاربران میتوانند تنها با توصیف تغییرات موردنظر، ویدیوهای خود را ویرایش یا محتوای جدید تولید کنند.
گوگل اعلام کرده Omni Flash برای تولید ویدیو از دانش عمومی مدل جمینای در حوزههایی مانند تاریخ، زیستشناسی و منطق روایی استفاده میکند و میتواند متن، گرافیک و عناصر بصری را بهصورت هماهنگ در ویدیو قرار دهد.
در نسخه فعلی، کاربران میتوانند ویدیوهایی با حداکثر ۱۰ ثانیه تولید کنند، اما گوگل وعده داده این محدودیت در بهروزرسانیهای آینده افزایش خواهد یافت.
به گفته گوگل، این دو ابزار بهگونهای طراحی شدهاند که در کنار یکدیگر بهترین عملکرد را داشته باشند؛ بهعنوان مثال کاربران میتوانند ابتدا تصویر موردنظر خود را با Nano Banana 2 Lite ایجاد کرده و سپس همان تصویر را به Gemini Omni Flash بدهند تا آن را به یک ویدیوی متحرک تبدیل کند.
گوگل همچنین اعلام کرده تمامی تصاویر و ویدیوهای تولیدشده با این مدلها به فناوری SynthID مجهز هستند؛ واترمارک نامرئیای که به شناسایی محتوای تولیدشده توسط هوش مصنوعی کمک میکند و با هدف افزایش شفافیت و مقابله با انتشار اطلاعات گمراهکننده توسعه یافته است.
کد خبر ۲۱۲۰۵۰۴۱۰.۷۱۸
منبع :گوگل بلاگ