صداهای تولیدشده توسط هوش مصنوعی، قابل تمایز از انسان نیستند

انتشار: 5 مهر 1404

تحقیقات جدید دانشگاه کوئین مری لندن نشان می‌دهد که فناوری تولید صدا توسط هوش مصنوعی اکنون قادر است صداهایی تولید کند که از صداهای واقعی انسان قابل تمایز نیستند. این صداها، شامل «کلون‌های صوتی» یا دیپ‌فیک‌ها هستند که کیفیت و واقع‌نمایی آن‌ها به حدی رسیده که شنوندگان معمولی نمی‌توانند تفاوتی میان آن‌ها و صداهای واقعی انسان تشخیص دهند.

در این مطالعه، صداهای واقعی انسان با دو نوع صداهای مصنوعی تولیدشده توسط پیشرفته‌ترین ابزارهای هوش مصنوعی مقایسه شدند. برخی از این صداها از روی ضبط صدای واقعی افراد کلون شده و برخی دیگر از مدل‌های بزرگ صوتی تولید شده و فاقد نمونه انسانی مشخص بودند. شرکت‌کنندگان در تحقیق باید تشخیص می‌دادند کدام صداها واقعی‌تر، مطمئن‌تر یا قوی‌تر به نظر می‌رسند. نتایج نشان داد که صداهای کلون‌شده تا حدی واقعی به نظر می‌رسند که تشخیص آن‌ها از صداهای انسانی بسیار دشوار است.

دکتر نادین لاوان، استاد روانشناسی دانشگاه کوئین مری و همکار این مطالعه، گفت: «صداهای تولیدشده توسط هوش مصنوعی اکنون همه‌جا حضور دارند؛ از الکسا و سیری گرفته تا سیستم‌های پاسخگویی خودکار مشتریان. فناوری AI اکنون قادر است صداهای طبیعی و انسان‌مانند بسازد و ما باید سریعاً درک کنیم که مردم این صداها را چگونه می‌پذیرند.»

وی افزود که ایجاد کلون‌های صوتی واقعی با حداقل تخصص، تنها با چند دقیقه ضبط صدا و تقریباً بدون هزینه، به‌سادگی ممکن است. سرعت پیشرفت این فناوری بسیار زیاد است و پیامدهای مهمی برای اخلاق، حق نشر، امنیت و مقابله با اطلاعات نادرست، کلاهبرداری و جعل هویت به همراه دارد.

با این حال، تولید گسترده صداهای واقعی توسط هوش مصنوعی فرصت‌های جذابی نیز ایجاد می‌کند؛ از جمله بهبود دسترسی، آموزش و تجربه کاربری، جایی که صداهای مصنوعی با کیفیت بالا می‌توانند ارتباطات را تسهیل کنند.

کد خبر ۲۰۲۰۴۰۷۰۵.۰۲۹

منبع: یورک آلرت