هوش مصنوعی میتواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفتانگیزی – اما همچنان محدود – رمزگشایی کند. هوش مصنوعی تنها با استفاده از چند ثانیه از داده های فعالیت مغز، آنچه را که شخص شنیده است حدس می زند. محققان در یک مطالعه اولیه دریافتند که این پاسخ صحیح را در ۷۳ درصد مواقع در ۱۰ احتمال برتر فهرست می کند.
جیووانی دی لیبرتو میگوید: «عملکرد هوش مصنوعی بالاتر از آن چیزی بود که بسیاری از مردم فکر میکردند در این مرحله ممکن است».
محققان در ۲۵ آگوست گزارش دادند که هوش مصنوعی که در شرکت مادر فیس بوک، متا توسعه یافته است، در نهایت می تواند برای کمک به هزاران نفر در سراسر جهان که قادر به برقراری ارتباط از طریق گفتار، تایپ یا اشاره نیستند، استفاده شود. این شامل بسیاری از بیمارانی است که با حداقل هوشیاری، قفل شده یا “حالت نباتی” زندگی می کنند.
بیشتر فناوریهای موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحیهای خطرناک مغز برای کاشت الکترود دارند. ژان رمی کینگ، عصب شناس، محقق هوش مصنوعی متا می گوید: «این رویکرد جدید می تواند بدون استفاده از روش های تهاجمی، راهی مناسب برای کمک به بیماران مبتلا به نقص های ارتباطی فراهم کند.»
کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در ۵۶۰۰۰ ساعت ضبط گفتار از ۵۳ زبان آموزش دادند. این ابزار که به عنوان یک مدل زبان نیز شناخته میشود، یاد گرفت که چگونه ویژگیهای خاص زبان را هم در سطح دقیق – به حروف یا هجاها فکر کنید – و هم در سطح گستردهتر، مانند یک کلمه یا جمله، تشخیص دهد.
این تیم یک هوش مصنوعی با این مدل زبان را در پایگاههای اطلاعاتی چهار موسسه که شامل فعالیت مغزی ۱۶۹ داوطلب میشد، اعمال کردند. در این پایگاههای اطلاعاتی، شرکتکنندگان به داستانها و جملات مختلفی از جمله «پیرمرد و دریا» اثر ارنست همینگوی و «ماجراهای آلیس در سرزمین عجایب» اثر لوئیس کارول گوش میدادند، در حالی که مغز افراد با استفاده از مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی اسکن میشد. این تکنیک ها جزء مغناطیسی یا الکتریکی سیگنال های مغز را اندازه گیری می کنند.
سپس با کمک یک روش محاسباتی که به توضیح تفاوتهای فیزیکی بین مغزهای واقعی کمک میکند، تیم تلاش کرد تا آنچه شرکتکنندگان شنیدهاند را با استفاده از تنها سه ثانیه دادههای فعالیت مغز از هر فرد رمزگشایی کنند. این تیم به هوش مصنوعی دستور داد تا صداهای گفتار را از ضبط داستان با الگوهای فعالیت مغزی که هوش مصنوعی مطابق با آنچه مردم میشنوند محاسبه میکند، تراز کند. سپس با توجه به بیش از ۱۰۰۰ احتمال، پیشبینیهایی درباره آنچه ممکن است فرد در این مدت کوتاه میشنود، انجام داد.
محققان دریافتند با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در ۷۳ درصد مواقع در ۱۰ حدس برتر هوش مصنوعی قرار داشت. با الکتروانسفالوگرافی، این مقدار به بیش از ۳۰ درصد کاهش یافت.
دی لیبرتو میگوید:”هوش مصنوعی اطلاعات شرکتکنندگانی را که منفعلانه به صدا گوش میدهند رمزگشایی میکند، که مستقیماً به بیماران غیرکلامی مربوط نمیشود. برای اینکه این ابزار به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید بیاموزند که چگونه از فعالیت مغز آنچه این بیماران قصد گفتن دارند رمزگشایی کنند، از جمله ابراز گرسنگی، ناراحتی یا یک «بله» یا «نه» ساده.”
جیووانی دی لیبرتو میگوید: «عملکرد هوش مصنوعی بالاتر از آن چیزی بود که بسیاری از مردم فکر میکردند در این مرحله ممکن است».
محققان در ۲۵ آگوست گزارش دادند که هوش مصنوعی که در شرکت مادر فیس بوک، متا توسعه یافته است، در نهایت می تواند برای کمک به هزاران نفر در سراسر جهان که قادر به برقراری ارتباط از طریق گفتار، تایپ یا اشاره نیستند، استفاده شود. این شامل بسیاری از بیمارانی است که با حداقل هوشیاری، قفل شده یا “حالت نباتی” زندگی می کنند.
بیشتر فناوریهای موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحیهای خطرناک مغز برای کاشت الکترود دارند. ژان رمی کینگ، عصب شناس، محقق هوش مصنوعی متا می گوید: «این رویکرد جدید می تواند بدون استفاده از روش های تهاجمی، راهی مناسب برای کمک به بیماران مبتلا به نقص های ارتباطی فراهم کند.»
کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در ۵۶۰۰۰ ساعت ضبط گفتار از ۵۳ زبان آموزش دادند. این ابزار که به عنوان یک مدل زبان نیز شناخته میشود، یاد گرفت که چگونه ویژگیهای خاص زبان را هم در سطح دقیق – به حروف یا هجاها فکر کنید – و هم در سطح گستردهتر، مانند یک کلمه یا جمله، تشخیص دهد.
این تیم یک هوش مصنوعی با این مدل زبان را در پایگاههای اطلاعاتی چهار موسسه که شامل فعالیت مغزی ۱۶۹ داوطلب میشد، اعمال کردند. در این پایگاههای اطلاعاتی، شرکتکنندگان به داستانها و جملات مختلفی از جمله «پیرمرد و دریا» اثر ارنست همینگوی و «ماجراهای آلیس در سرزمین عجایب» اثر لوئیس کارول گوش میدادند، در حالی که مغز افراد با استفاده از مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی اسکن میشد. این تکنیک ها جزء مغناطیسی یا الکتریکی سیگنال های مغز را اندازه گیری می کنند.
سپس با کمک یک روش محاسباتی که به توضیح تفاوتهای فیزیکی بین مغزهای واقعی کمک میکند، تیم تلاش کرد تا آنچه شرکتکنندگان شنیدهاند را با استفاده از تنها سه ثانیه دادههای فعالیت مغز از هر فرد رمزگشایی کنند. این تیم به هوش مصنوعی دستور داد تا صداهای گفتار را از ضبط داستان با الگوهای فعالیت مغزی که هوش مصنوعی مطابق با آنچه مردم میشنوند محاسبه میکند، تراز کند. سپس با توجه به بیش از ۱۰۰۰ احتمال، پیشبینیهایی درباره آنچه ممکن است فرد در این مدت کوتاه میشنود، انجام داد.
محققان دریافتند با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در ۷۳ درصد مواقع در ۱۰ حدس برتر هوش مصنوعی قرار داشت. با الکتروانسفالوگرافی، این مقدار به بیش از ۳۰ درصد کاهش یافت.
دی لیبرتو میگوید:”هوش مصنوعی اطلاعات شرکتکنندگانی را که منفعلانه به صدا گوش میدهند رمزگشایی میکند، که مستقیماً به بیماران غیرکلامی مربوط نمیشود. برای اینکه این ابزار به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید بیاموزند که چگونه از فعالیت مغز آنچه این بیماران قصد گفتن دارند رمزگشایی کنند، از جمله ابراز گرسنگی، ناراحتی یا یک «بله» یا «نه» ساده.”
کد خبر ۲۱۵۰۱۰۶۲۰.۴۶۶