انویدیا مدل هوش مصنوعی جدیدی برای تغییر صدا و تولید افکت‌های صوتی معرفی کرد

انتشار: 7 آذر 1403

شرکت انویدیا مدل جدیدی از هوش مصنوعی را معرفی کرد که قادر به تغییر صداها و تولید صداهای جدید است. این تکنولوژی که برای تولیدکنندگان موسیقی، فیلم و بازی‌های ویدیویی طراحی شده، قابلیت تغییر صداها و تولید افکت‌های صوتی و موسیقی را از یک توصیف متنی دارد. این مدل که “فوگاتو” نامیده می‌شود، مخفف “فاندیشنال جنراتیو آویدیو ترنسفورمر اوپوس ۱” است، به‌طور خاص قادر است صداهایی مانند صدای یک ترومپت را به صدای سگی تغییر دهد.

انویدیا که بزرگترین تأمین‌کننده چیپ و نرم‌افزارهای مورد استفاده در سیستم‌های هوش مصنوعی است، اعلام کرد که برنامه‌ای برای انتشار عمومی این فناوری ندارد. این مدل همچنین قادر است صدای ضبط‌شده را تغییر دهد، به‌طور مثال یک خط نواخته شده بر روی پیانو را به صدای انسانی تبدیل کند یا لحن و لهجه یک گویش را تغییر دهد.

برایان کاتانزارو، معاون رئیس‌جمهور تحقیقات یادگیری عمیق در انویدیا، در این باره گفت: “اگر به صدای مصنوعی در پنجاه سال گذشته فکر کنیم، موسیقی حالا به‌واسطه کامپیوترها و سینت‌سایزرها متفاوت شده است. من فکر می‌کنم که هوش مصنوعی تولیدی قابلیت‌های جدیدی را به موسیقی، بازی‌های ویدیویی و حتی به افرادی که می‌خواهند چیزهایی بسازند، می‌آورد.”

مدل جدید انویدیا از داده‌های متن‌باز برای آموزش استفاده کرده است و این شرکت هنوز در حال بررسی این موضوع است که آیا این فناوری را به‌طور عمومی منتشر کند یا نه. کاتانزارو در این‌باره گفت: “هر فناوری تولیدی همیشه با برخی ریسک‌ها همراه است، زیرا افراد ممکن است از آن برای تولید محتواهایی استفاده کنند که ما تمایلی به آن نداریم.”

در حال حاضر، شرکت‌هایی مانند OpenAI و متا نیز برنامه‌ای برای انتشار مدل‌های مشابه خود که قادر به تولید صدا یا ویدیو از متن هستند، اعلام نکرده‌اند.

کد خبر ۲۱۳۰۳۰۹۰۷.۰۷۵