به گزارش سرویس وبگردی خبرگزاری صدا و سیما ، پیشرفتهای اخیر در زمینه یادگیری ماشینی (ML) کیفیت ابزارهای ترجمه خودکار را تا حد زیادی بهبود بخشیده است.
در حال حاضر ابزار کنونی اغلب برای ترجمه جملات اساسی و همچنین متون کوتاه یا اسناد غیر رسمی استفاده میشود. متون ادبی مانند رمان یا داستان کوتاه هنوز به طور کامل توسط مترجمان انسانی متخصص ترجمه میشود که در درک معانی انتزاعی و پیچیده و ترجمه آن به زبانی دیگر مجرب هستند. در حالی که چند تحقیق توانایی مدلهای محاسباتی را برای ترجمه متون ادبی بررسی کردهاند، اما یافتهها در این زمینه هنوز محدود است.
محققان دانشگاه ماساچوست امهرست آمریکا به تازگی مطالعهای انجام دادهاند که کیفیت ترجمههای متون ادبی تولید شده توسط ماشینها را با مقایسه آنها با ترجمههای متنی مشابه ایجاد شده توسط انسان بررسی و برخی از کاستیهای مدلهای محاسباتی موجود برای ترجمه متون خارجی به انگلیسی را برجسته کرد.
کاترین تای و همکارانش، از پژوهشگران این تحقیق، گفتند: ترجمه ماشینی (MT) دارای ظرفیت تکمیل کار مترجمان انسانی با بهبود روشهای آموزشی و کارایی کلی آنهاست. ترجمه ادبی نسبت به تنظیمات سنتی ترجمه ماشینی محدودیت کمتری دارد، زیرا مترجمان باید معادلسازی معنا، خوانایی و تفسیرپذیری انتقادی را در زبان مقصد متعادل کنند. این ویژگی همراه با زمینه پیچیده در سطح گفتمان موجود در متون ادبی، ترجمه ماشینی ادبی را برای مدلسازی و ارزیابی محاسباتی نیز چالش برانگیزتر میکند.
هدف اصلی کار اخیر تای و همکارانش درک بهتر روشهایی بود که ابزارهای پیشرفته ترجمه ماشینی در مقایسه با ترجمههای انسانی هنوز در ترجمه متون ادبی شکست میخورند. امید آنان این بود که این کار به شناسایی زمینههای خاصی که توسعهدهندگان باید روی بهبود عملکرد این مدلها تمرکز کنند، کمک کند.
تای و همکارانش توضیح دادند: ما یک مجموعه داده (PAR ۳) از رمانهای غیرانگلیسی زبان را در حوزه عمومی جمعآوری میکنیم که هر کدام در سطح پاراگراف با ترجمههای انسانی و خودکار انگلیسی تراز شدهاند.
مجموعه داده جدیدی که توسط محققان برای دامنه تحقیق خود گردآوری شده است، شامل ۱۲۱ هزار پاراگراف استخراج شده از ۱۱۸ رمان است که در اصل به زبانهای مختلف به جز انگلیسی نوشته شدهاند. برای هر یک از این پاراگرافها مجموعه داده شامل چندین ترجمه انسانی مختلف همچنین ترجمهای است که توسط ترجمه گوگل (Google translate) تولید شد.
محققان با استفاده از معیارهای رایج برای ارزیابی ابزارهای ترجمه ماشینی، کیفیت ترجمههای انسانی این پاراگرافهای ادبی را با ترجمههای مترجم گوگل مقایسه کردند. همزمان آنان از مترجمان انسانی متخصص پرسیدند که کدام ترجمهها را ترجیح میدهند؛ در حالی که آنان را ترغیب کردند تا مواردی را با کمترین ترجیح ترجمه خود شناسایی کنند.
تای و همکارانش اظهار کردند: با استفاده از مجموعه داده (PAR ۳) متوجه شدیم که مترجمان ادبی خبره ترجمههای انسانی مرجع را به پاراگرافهای ترجمه شده ماشینی به میزان ۸۴ درصد ترجیح میدهند؛ در حالی که معیارهای پیشرفته ترجمه ماشینی خودکار با این اولویتها مرتبط نیست. کارشناسان خاطرنشان میکنند خروجیهای ترجمه ماشینی نه %
در حال حاضر ابزار کنونی اغلب برای ترجمه جملات اساسی و همچنین متون کوتاه یا اسناد غیر رسمی استفاده میشود. متون ادبی مانند رمان یا داستان کوتاه هنوز به طور کامل توسط مترجمان انسانی متخصص ترجمه میشود که در درک معانی انتزاعی و پیچیده و ترجمه آن به زبانی دیگر مجرب هستند. در حالی که چند تحقیق توانایی مدلهای محاسباتی را برای ترجمه متون ادبی بررسی کردهاند، اما یافتهها در این زمینه هنوز محدود است.
محققان دانشگاه ماساچوست امهرست آمریکا به تازگی مطالعهای انجام دادهاند که کیفیت ترجمههای متون ادبی تولید شده توسط ماشینها را با مقایسه آنها با ترجمههای متنی مشابه ایجاد شده توسط انسان بررسی و برخی از کاستیهای مدلهای محاسباتی موجود برای ترجمه متون خارجی به انگلیسی را برجسته کرد.
کاترین تای و همکارانش، از پژوهشگران این تحقیق، گفتند: ترجمه ماشینی (MT) دارای ظرفیت تکمیل کار مترجمان انسانی با بهبود روشهای آموزشی و کارایی کلی آنهاست. ترجمه ادبی نسبت به تنظیمات سنتی ترجمه ماشینی محدودیت کمتری دارد، زیرا مترجمان باید معادلسازی معنا، خوانایی و تفسیرپذیری انتقادی را در زبان مقصد متعادل کنند. این ویژگی همراه با زمینه پیچیده در سطح گفتمان موجود در متون ادبی، ترجمه ماشینی ادبی را برای مدلسازی و ارزیابی محاسباتی نیز چالش برانگیزتر میکند.
هدف اصلی کار اخیر تای و همکارانش درک بهتر روشهایی بود که ابزارهای پیشرفته ترجمه ماشینی در مقایسه با ترجمههای انسانی هنوز در ترجمه متون ادبی شکست میخورند. امید آنان این بود که این کار به شناسایی زمینههای خاصی که توسعهدهندگان باید روی بهبود عملکرد این مدلها تمرکز کنند، کمک کند.
تای و همکارانش توضیح دادند: ما یک مجموعه داده (PAR ۳) از رمانهای غیرانگلیسی زبان را در حوزه عمومی جمعآوری میکنیم که هر کدام در سطح پاراگراف با ترجمههای انسانی و خودکار انگلیسی تراز شدهاند.
مجموعه داده جدیدی که توسط محققان برای دامنه تحقیق خود گردآوری شده است، شامل ۱۲۱ هزار پاراگراف استخراج شده از ۱۱۸ رمان است که در اصل به زبانهای مختلف به جز انگلیسی نوشته شدهاند. برای هر یک از این پاراگرافها مجموعه داده شامل چندین ترجمه انسانی مختلف همچنین ترجمهای است که توسط ترجمه گوگل (Google translate) تولید شد.
محققان با استفاده از معیارهای رایج برای ارزیابی ابزارهای ترجمه ماشینی، کیفیت ترجمههای انسانی این پاراگرافهای ادبی را با ترجمههای مترجم گوگل مقایسه کردند. همزمان آنان از مترجمان انسانی متخصص پرسیدند که کدام ترجمهها را ترجیح میدهند؛ در حالی که آنان را ترغیب کردند تا مواردی را با کمترین ترجیح ترجمه خود شناسایی کنند.
تای و همکارانش اظهار کردند: با استفاده از مجموعه داده (PAR ۳) متوجه شدیم که مترجمان ادبی خبره ترجمههای انسانی مرجع را به پاراگرافهای ترجمه شده ماشینی به میزان ۸۴ درصد ترجیح میدهند؛ در حالی که معیارهای پیشرفته ترجمه ماشینی خودکار با این اولویتها مرتبط نیست. کارشناسان خاطرنشان میکنند خروجیهای ترجمه ماشینی نه %