هوش مصنوعی می تواند گفتار را از روی فعالیت مغز رمزگشایی کند

هوش مصنوعی می تواند گفتار را از روی فعالیت مغز رمزگشایی کند
فهرست مطالب
 هوش مصنوعی می‌تواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفت‌انگیزی – اما همچنان محدود – رمزگشایی کند. هوش مصنوعی تنها با استفاده از چند ثانیه از داده های فعالیت مغز، آنچه را که شخص شنیده است حدس می زند. محققان در یک مطالعه اولیه دریافتند که این پاسخ صحیح را در ۷۳ درصد مواقع در ۱۰ احتمال برتر فهرست می کند.
جیووانی دی لیبرتو می‌گوید: «عملکرد هوش مصنوعی بالاتر از آن چیزی بود که بسیاری از مردم فکر می‌کردند در این مرحله ممکن است».
محققان در ۲۵ آگوست گزارش دادند که هوش مصنوعی که در شرکت مادر فیس بوک، متا توسعه یافته است، در نهایت می تواند برای کمک به هزاران نفر در سراسر جهان که قادر به برقراری ارتباط از طریق گفتار، تایپ یا اشاره نیستند، استفاده شود. این شامل بسیاری از بیمارانی است که با حداقل هوشیاری، قفل شده یا “حالت نباتی” زندگی می کنند.
بیشتر فناوری‌های موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحی‌های خطرناک مغز برای کاشت الکترود دارند. ژان رمی کینگ، عصب شناس، محقق هوش مصنوعی متا می گوید: «این رویکرد جدید می تواند بدون استفاده از روش های تهاجمی، راهی مناسب برای کمک به بیماران مبتلا به نقص های ارتباطی فراهم کند.»
کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در ۵۶۰۰۰ ساعت ضبط گفتار از ۵۳ زبان آموزش دادند. این ابزار که به عنوان یک مدل زبان نیز شناخته می‌شود، یاد گرفت که چگونه ویژگی‌های خاص زبان را هم در سطح دقیق – به حروف یا هجاها فکر کنید – و هم در سطح گسترده‌تر، مانند یک کلمه یا جمله، تشخیص دهد.
این تیم یک هوش مصنوعی با این مدل زبان را در پایگاه‌های اطلاعاتی چهار موسسه که شامل فعالیت مغزی ۱۶۹ داوطلب می‌شد، اعمال کردند. در این پایگاه‌های اطلاعاتی، شرکت‌کنندگان به داستان‌ها و جملات مختلفی از جمله «پیرمرد و دریا» اثر ارنست همینگوی و «ماجراهای آلیس در سرزمین عجایب» اثر لوئیس کارول گوش می‌دادند، در حالی که مغز افراد با استفاده از مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی اسکن می‌شد. این تکنیک ها جزء مغناطیسی یا الکتریکی سیگنال های مغز را اندازه گیری می کنند.
سپس با کمک یک روش محاسباتی که به توضیح تفاوت‌های فیزیکی بین مغزهای واقعی کمک می‌کند، تیم تلاش کرد تا آنچه شرکت‌کنندگان شنیده‌اند را با استفاده از تنها سه ثانیه داده‌های فعالیت مغز از هر فرد رمزگشایی کنند. این تیم به هوش مصنوعی دستور داد تا صداهای گفتار را از ضبط داستان با الگوهای فعالیت مغزی که هوش مصنوعی مطابق با آنچه مردم می‌شنوند محاسبه می‌کند، تراز کند. سپس با توجه به بیش از ۱۰۰۰ احتمال، پیش‌بینی‌هایی درباره آنچه ممکن است فرد در این مدت کوتاه می‌شنود، انجام داد.
محققان دریافتند با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در ۷۳ درصد مواقع در ۱۰ حدس برتر هوش مصنوعی قرار داشت. با الکتروانسفالوگرافی، این مقدار به بیش از ۳۰ درصد کاهش یافت.
دی لیبرتو می‌گوید:”هوش مصنوعی اطلاعات شرکت‌کنندگانی را که منفعلانه به صدا گوش می‌دهند رمزگشایی می‌کند، که مستقیماً به بیماران غیرکلامی مربوط نمی‌شود. برای اینکه این ابزار به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید بیاموزند که چگونه از فعالیت مغز آنچه این بیماران قصد گفتن دارند رمزگشایی کنند، از جمله ابراز گرسنگی، ناراحتی یا یک «بله» یا «نه» ساده.”
کد خبر ۲۱۵۰۱۰۶۲۰.۴۶۶

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اشتراک گذاری خبر:
برچسب‌ها: