هوش مصنوعی هنوز راه زیادی برای درک ظرایف فرهنگی در پیش دارد. یک پژوهش تازه به سرپرستی نیکتا گوهریصدر، پژوهشگر ایرانی، نشان میدهد که حتی پیشرفتهترین مدلهای زبانی دنیا مانند GPT-4o، کلود ۳.۵، لاما ۳ و دیپسیک V3 در بازشناسی و پاسخ درست به تعارفهای رایج ایرانی با مشکل جدی روبهرو هستند.
در این تحقیق، مجموعهای از موقعیتهای واقعی و روزمره که در فرهنگ ایرانی پر از تعارف است، به مدلهای هوش مصنوعی ارائه شد. نتایج نشان داد این مدلها تنها در حدود ۴۰ درصد موارد توانستند موقعیت تعارف را تشخیص داده و پاسخ مناسب بدهند. در مقابل، فارسیزبانان بومی در بیش از ۸۰ درصد موارد عملکرد موفق داشتند.
پژوهشگران برای سنجش این موضوع معیار تازهای به نام TAAROFBENCH معرفی کردند که توانایی هوش مصنوعی را در شناسایی و بازتولید تعارف میسنجد. این معیار میتواند بهعنوان الگویی برای بررسی دیگر ظرایف فرهنگی در زبانها و جوامع مختلف نیز مورد استفاده قرار گیرد.
نتایج مطالعه نشان میدهد که مدلهای زبانی غالباً بر اساس الگوهای ارتباطی صریح و مستقیم غربی عمل میکنند و همین موضوع باعث میشود در مواجهه با سبک غیرمستقیم و چندلایه تعارف ایرانی دچار سردرگمی شوند. پژوهشگران هشدار دادهاند که این ضعف میتواند در مذاکرات رسمی، تعاملات تجاری یا حتی گفتوگوهای روزمره بینفرهنگی منجر به سوءتفاهمهای جدی شود.
این تحقیق علاوه بر برجسته کردن اهمیت آموزش دادههای فرهنگی متنوع برای هوش مصنوعی، یادآور میشود که هیچ الگوریتمی بدون شناخت عمیق از بافتهای فرهنگی و اجتماعی نمیتواند جایگزین ارتباط انسانی شود.
کد خبر ۲۱۲۰۴۰۷۰۶.۵۵۹
منبع:ارز تکنیکا