شرکت متا در همکاری با یونسکو برنامه جدیدی را به منظور جمعآوری سخنرانی ها و متون نوشتاری راهاندازی کرده است که به گفته این شرکت، به توسعه هوش مصنوعی قابل دسترسی در آینده کمک خواهد کرد. این برنامه تحت عنوان «برنامه همکاران فناوری زبان» به دنبال همکارانی است که بتوانند بیش از ۱۰ ساعت ضبط گفتار به همراه متون نوشتاری، مقادیر زیادی متن نوشتهشده، و مجموعههایی از جملات ترجمهشده به زبانهای مختلف ارائه دهند.
طبق اعلام متا، شرکای این برنامه با تیمهای هوش مصنوعی این شرکت همکاری خواهند کرد تا این زبانها را در مدلهای شناسایی گفتار و ترجمه هوش مصنوعی ادغام کنند که پس از تکمیل، به صورت منبعباز منتشر خواهند شد.
برخی از شرکای فعلی این برنامه شامل دولت نوناووت در کانادا هستند که برخی از ساکنان آن به زبانهای اینوکوتوت (Inuktut) صحبت میکنند.
متا در یک پست وبلاگی اظهار داشت: «تلاشهای ما بهویژه متمرکز بر زبانهای کمتوجه است، در راستای حمایت از کار یونسکو.» هدف نهایی این شرکت ایجاد سیستمهای هوشمندی است که قادر به درک و پاسخ به نیازهای پیچیده انسانی، صرف نظر از زبان یا پیشینه فرهنگی، باشند.
همزمان با این برنامه، متا اعلام کرده که یک معیار ترجمه ماشینی منبعباز نیز منتشر خواهد کرد تا عملکرد مدلهای ترجمه زبان را ارزیابی کند. این معیار از جملات تنظیمشده توسط زبانشناسان پشتیبانی میکند و از هفت زبان پشتیبانی میکند و از طریق پلتفرم توسعه هوش مصنوعی Hugging Face قابل دسترسی و مشارکت است.
متا این دو ابتکار را بهعنوان تلاشهای بشردوستانه معرفی کرده است، با این حال، این شرکت از مدلهای بهبود یافته شناسایی گفتار و ترجمه بهرهمند خواهد شد. این شرکت همچنان در حال گسترش زبانهایی است که دستیار هوش مصنوعی آن، Meta AI، پشتیبانی میکند و ویژگیهای آزمایشی مانند ترجمه خودکار برای سازندگان محتوا را نیز در دست اجرا دارد.
انتقادهای زیادی در مورد نحوه برخورد متا با محتواهای غیرانگلیسی در پلتفرمهایش وجود دارد. بر اساس یکی از گزارشها، فیسبوک تقریباً ۷۰ درصد از اطلاعات غلط مرتبط با COVID به زبانهای ایتالیایی و اسپانیایی را بدون علامتگذاری رها کرده است، در حالی که تنها ۲۹ درصد از اطلاعات مشابه به زبان انگلیسی را نادیده گرفته است. اسناد درز کرده از این شرکت نشان میدهند که پستهای به زبان عربی به طور مکرر به اشتباه به عنوان سخنان نفرتانگیز علامتگذاری میشوند.
متا اعلام کرده که در حال انجام اقدامات برای بهبود تکنولوژیهای ترجمه و نظارت خود است.
کد خبر ۲۱۲۰۳۱۱۲۱.۰۲۶
منبع:تک کرانچ