شرکت انویدیا مدل جدیدی از هوش مصنوعی را معرفی کرد که قادر به تغییر صداها و تولید صداهای جدید است. این تکنولوژی که برای تولیدکنندگان موسیقی، فیلم و بازیهای ویدیویی طراحی شده، قابلیت تغییر صداها و تولید افکتهای صوتی و موسیقی را از یک توصیف متنی دارد. این مدل که “فوگاتو” نامیده میشود، مخفف “فاندیشنال جنراتیو آویدیو ترنسفورمر اوپوس ۱” است، بهطور خاص قادر است صداهایی مانند صدای یک ترومپت را به صدای سگی تغییر دهد.
انویدیا که بزرگترین تأمینکننده چیپ و نرمافزارهای مورد استفاده در سیستمهای هوش مصنوعی است، اعلام کرد که برنامهای برای انتشار عمومی این فناوری ندارد. این مدل همچنین قادر است صدای ضبطشده را تغییر دهد، بهطور مثال یک خط نواخته شده بر روی پیانو را به صدای انسانی تبدیل کند یا لحن و لهجه یک گویش را تغییر دهد.
برایان کاتانزارو، معاون رئیسجمهور تحقیقات یادگیری عمیق در انویدیا، در این باره گفت: “اگر به صدای مصنوعی در پنجاه سال گذشته فکر کنیم، موسیقی حالا بهواسطه کامپیوترها و سینتسایزرها متفاوت شده است. من فکر میکنم که هوش مصنوعی تولیدی قابلیتهای جدیدی را به موسیقی، بازیهای ویدیویی و حتی به افرادی که میخواهند چیزهایی بسازند، میآورد.”
مدل جدید انویدیا از دادههای متنباز برای آموزش استفاده کرده است و این شرکت هنوز در حال بررسی این موضوع است که آیا این فناوری را بهطور عمومی منتشر کند یا نه. کاتانزارو در اینباره گفت: “هر فناوری تولیدی همیشه با برخی ریسکها همراه است، زیرا افراد ممکن است از آن برای تولید محتواهایی استفاده کنند که ما تمایلی به آن نداریم.”
در حال حاضر، شرکتهایی مانند OpenAI و متا نیز برنامهای برای انتشار مدلهای مشابه خود که قادر به تولید صدا یا ویدیو از متن هستند، اعلام نکردهاند.
کد خبر ۲۱۳۰۳۰۹۰۷.۰۷۵