تحقیقات جدید دانشگاه کوئین مری لندن نشان میدهد که فناوری تولید صدا توسط هوش مصنوعی اکنون قادر است صداهایی تولید کند که از صداهای واقعی انسان قابل تمایز نیستند. این صداها، شامل «کلونهای صوتی» یا دیپفیکها هستند که کیفیت و واقعنمایی آنها به حدی رسیده که شنوندگان معمولی نمیتوانند تفاوتی میان آنها و صداهای واقعی انسان تشخیص دهند.
در این مطالعه، صداهای واقعی انسان با دو نوع صداهای مصنوعی تولیدشده توسط پیشرفتهترین ابزارهای هوش مصنوعی مقایسه شدند. برخی از این صداها از روی ضبط صدای واقعی افراد کلون شده و برخی دیگر از مدلهای بزرگ صوتی تولید شده و فاقد نمونه انسانی مشخص بودند. شرکتکنندگان در تحقیق باید تشخیص میدادند کدام صداها واقعیتر، مطمئنتر یا قویتر به نظر میرسند. نتایج نشان داد که صداهای کلونشده تا حدی واقعی به نظر میرسند که تشخیص آنها از صداهای انسانی بسیار دشوار است.
دکتر نادین لاوان، استاد روانشناسی دانشگاه کوئین مری و همکار این مطالعه، گفت: «صداهای تولیدشده توسط هوش مصنوعی اکنون همهجا حضور دارند؛ از الکسا و سیری گرفته تا سیستمهای پاسخگویی خودکار مشتریان. فناوری AI اکنون قادر است صداهای طبیعی و انسانمانند بسازد و ما باید سریعاً درک کنیم که مردم این صداها را چگونه میپذیرند.»
وی افزود که ایجاد کلونهای صوتی واقعی با حداقل تخصص، تنها با چند دقیقه ضبط صدا و تقریباً بدون هزینه، بهسادگی ممکن است. سرعت پیشرفت این فناوری بسیار زیاد است و پیامدهای مهمی برای اخلاق، حق نشر، امنیت و مقابله با اطلاعات نادرست، کلاهبرداری و جعل هویت به همراه دارد.
با این حال، تولید گسترده صداهای واقعی توسط هوش مصنوعی فرصتهای جذابی نیز ایجاد میکند؛ از جمله بهبود دسترسی، آموزش و تجربه کاربری، جایی که صداهای مصنوعی با کیفیت بالا میتوانند ارتباطات را تسهیل کنند.
کد خبر ۲۰۲۰۴۰۷۰۵.۰۲۹
منبع: یورک آلرت