مدل هوش مصنوعی جدید متا میتواند ۲۰۰ زبان را درک و بهطور لحظهای آنها را با دقتی کمنظیر به یکدیگر ترجمه کند.
این امر به لطف مارک زاکربرگ،مدیر عامل متا که آن را «یکی از سریعترین ابررایانههای جهان» مینامند، انجام شد .این هوش مصنوعی اکنون قادر به ترجمه ۲۰۰ زبان مختلف است، از جمله بسیاری از آنها که فاقد منابع هستند و توسط سیستمهای ترجمه فعلی پشتیبانی نمیشوند.
این شرکت نام این پروژه را “No Language Left Behind” گذاشته است و هدف آن دستیابی به حداقل ۲۵ میلیارد ترجمه در روز بین برنامه های متا است.
اگرچه امروزه بیش از ۷۱۰۰ زبان شناخته شده در جهان وجود دارد، بسیاری از آنها فاقد مجموعه داده های کافی برای آموزش هوش مصنوعی هستند. این زبانهای به اصطلاح کم منبع عبارتند از: عربی مصری، بالی، ساردینی، فولا نیجریه، بانسیران، امباندو و بسیاری دیگر. این زبانها توسط افراد کمی صحبت میشود.
مارک زاکربرگ گفت :«فناوری مدلسازی هوش مصنوعی که ما استفاده میکنیم کمک میکند تا به ترجمههایی با کیفیت بالا به این زبانها که توسط میلیاردها نفر در سراسر جهان صحبت میشود، برسیم.»
این شرکت گفت که این مدل میتواند ۵۵ زبان آفریقایی را با کیفیت بالا ترجمه کند.
برای درک اینکه چقدر این پروژه بزرگ است، این مدل از ۲۰۰ زبان بیش از ۵۰ میلیون پارامتر دارد و ما آن را روی یکی از سریعترین ابررایانههای جهان، Research SuperCluster (RSC) آموزش دادیم.
این پیشرفت ها به برنامه ما اجازه داده است که روزانه بیش از ۲۵ میلیارد ترجمه انجام دهد.
مارتا آر. کوستانزا، گفت :”برقراری ارتباطات بین زبان ها یکی از ابرقدرتهای هوش مصنوعی است، اما در حالی که به تلاشهای خود در زمینه هوش مصنوعی ادامه میدهیم، کار ما برای انتشار جالبترین محتوا در فیسبوک و اینستاگرام، توصیه مرتبطترین تبلیغات و تضمین امنیت خدمات برای همه کاربران همراه با آن در حال پیشرفت است.
این بدان معناست که تأثیر این فناوری به میلیاردها نفر در سراسر جهان خواهد رسید و به آنها اجازه میدهد به زبان خودشان ارتباط برقرار کنند.” Al Youngblood، محقق کاربران هوش مصنوعی متا نیز گفت: «این روش زندگی مردم، روش انجام تجارت و نحوه تحصیل آنها را تغییر خواهد داد. هر کاری که پروژه «No Language Left Behind» انجام می دهد بر این مأموریت متمرکز است و واقعاً انسان محور است.
برای انجام این پروژه، غول فناوری ابتدا نیاز به انجام مصاحبه های اکتشافی با گویشوران بومی زبان های کم منابع داشت تا نیازهای ترجمه آنها را درک کند. سپس یک مدل کامپیوتری توسعه یافت و مدل با دادههای جمعآوریشده با استفاده از تکنیکهای داده کاوی سفارشیسازی شده برای زبانهای کم منبع آموزش داده شد.
محققان همچنین خاطرنشان کردند که این پروژه زبان های کم منبع بیشتری را پوشش می دهد و در نتیجه نابرابری دیجیتال را کاهش می دهد.
از آنجایی که هدف پروژه «هیچ زبانی باقی نمانده» کاهش شکاف دیجیتالی جهانی است، زبانهای کممنبع بیشتری در آینده در محدوده پروژه گنجانده خواهند شد.»