ژاپن، روسیه و ترکیه، مقصد صادراتی «ترگمان»

جهان هر روز درحال تغییر است و تکنولوژی به موتور محرکه این تغییرات پرشتاب تبدیل شده است. حالا دیگر می توان ردپای هوش مصنوعی را در صنایع، حوزه سلامت، گفتار، نوشتار و... مشاهده کرد و دراین میان، یادگیری ماشینی (ML) به عنوان یکی از کاربردهای هوش مصنوعی (AI) برای توسعه قابلیت سیستمها بسیار مورد استفاده قرار می گیرد. این حوزه در ایران نیز مورد توجه فعالان حوزه هوش مصنوعی قرار گرفته است.یکی از این متخصصان، «سید محمد محمدزاده ضیابری»، دبیر کمیسیون هوش مصنوعی و علم داده سازمان نظام صنفی رایانهای است. وی که در زمینه هوش مصنوعی بویژه ترجمه و یادگیری ماشینی فعالیت دارد همراه با تیم خود موفق شده است اولین موتور ترجمه ماشینی آماری ایرانی را برای ترجمه از انگلیسی به فارسی توسعه دهد. او که حالا مدیرعامل شرکت پردازش هوشمند «ترگمان» است و ریاست کارگروه حکمرانی داده و زیرساخت هوش مصنوعی کمیسیون را نیز به عهده دارد، در مرکز نوآوری و توسعه هوش مصنوعی به گفتگو نشستیم که در زیر می خوانید.
رشته تخصصی شما ترجمه و یادگیری ماشینی است. این حوزه چه سابقه ای دارد و قابلیت های آن چیست؟
از حدود ۷۰ سال پیش انسان به دنبال راهی برای ترجمه توسط ماشین بود و سالها تلاش شد تا در این مسیر به مشابه روش انسانی از دیکشنری و قواعد زبانی برای تولید جملات استفاده شود اما این تلاشها نتیجه خوبی به دنبال نداشت چراکه زبان انسان لزوما قاعدهمند نیست و پر از ابهام است. با توجه به این موضوع، از حدود ۱۵سال پیش استفاده از روشهای یادگیری ماشینی (انواع آماری، نورونی و یادگیری عمیق)، جایگزین روشهای قاعدهمند شد و به این ترتیب ترجمه هایی با کیفیت بالا ارائه شد به گونه ای که امروزه می توان با استفاده از انواع الگوریتمهای مبتنی بر یادگیری عمیق ماشینها، ترجمههایی مناسب و نزدیک به ترجمه مترجمان حرفهای انسانی ارائه کرد.
کمی درباره موتور ترجمه «ترگمان» و چگونگی شکل گیری آن بگویید.
سابقه ترجمه ماشینی در ایران به دهه ۷۰ باز میگردد که البته تا سال ۹۰ همه تلاشها مبتنی بر روش قاعدهمند بود و کیفیت بالایی نداشت اما از اواخر دهه ۸۰ روشهای جدید ترجمه وارد بازار شدند و شرکت گوگل حدود سال ۱۳۸۷ موتور ترجمه انگلیسی - فارسی را ارائه کرد که باوجود کیفیت پایین، عملکرد بهتری نسبت به تمام موتورهای ترجمه آن زمان داشت.
این نیاز در بازار ایران هم احساس شد و خوشبختانه دولتمردان در آن زمان به سرعت به فکر جبران عقبماندگی افتادند و از توسعه ترجمه ماشینی حمایت مناسبی انجام شد. درواقع می توان گفت که «ترگمان» از دل یک حمایت دولتی شکل گرفت اما وابسته به دولت باقی نماند و راه خود را باز کرد. نطفه «ترگمان» در سال ۸۹ شکل گرفت و این موتور ترجمه در سال ۱۳۹۰ متولد شد.
در اردیبهشتماه ۱۳۹۰ قرار شد یک قرارداد تحقیقاتی برای توسعه موتور ترجمهماشینی آماری انگلیسی به فارسی با دانشگاه امیرکبیر منعقد شود. انعقاد این قرارداد منجر به تولد اولین موتور ترجمهماشینی آماری انگلیسی - فارسی ایرانی شد.
رقم قرارداد ۲۱۰میلیون تومان بود که از این مبلغ ۳۰ درصد (۶۳ میلیون تومان) سربار دانشگاه بود؛ ۵۰ میلیون تومان به دارالترجمه شبکه مترجمین ایران پرداخت شد تا اولین پیکره دو زبانه انگلیسی به فارسی به حجم ۱۰ میلیون کلمه تولید شود؛ ۱۰ میلیون تومان صرف خرید تجهیزات شد و عملا یکسال پروژه تحقیقاتی با رقمی بالغ بر ۱۳۷ میلیون تومان (حدود ماهی ۱۱ میلیون تومان) انجام شد.
این موتور ترجمه از ۶ماهگی توانست همه موتورهای ترجمه موجود آن زمان را پشت سر بگذارد و بعضاً افزایش کیفیت ترجمه تا ۱۷۰ درصد نسبت به برترین موتورهای ترجمه موجود در آن زمان ارائه کند؛ موضوعی که بسیار قابل توجه است و موفق شد نگاه ها را به خود جلب کند. «ترگمان» در اصل یک موتور ترجمه است که بر روی آن یک واسط کاربر برای استفاده رایگان هم مستقر شده است اما همین موتور برای ترجمه تخصصی و علمی منجر به تولید محصولی تجاری به نام «ترجمیار» شد که جزو معدود پروژههای هوش مصنوعی با فناوری بالای کشور است که از روش B2C (کسب و کار با مشتری)کسب درآمد میکند و با اقبال مردمی هم مواجه شده است.
با کمک این فناوری، شما چه کار ویژه ای در ایران انجام دادید؟
کاری که ما کردیم چند ویژگی مهم و قابل توجه داشت. درواقع ما در«ترگمان»، نخستین موتور ترجمه ماشینی آماری ایرانی را برای ترجمه از انگلیسی به فارسی توسعه دادیم. همچنین برای اولین بار در کشور موتور ترجمه فارسی به انگلیسی را با هزینهای بسیار اندک و از محل ۲۵ درصد افزایش قرارداد (کمتر از ۶۱ میلیون تومان) و در مدت 3ماه توسعه دادیم که اتفاق بزرگی بود چون در آن زمان سایر فعالین پیش بینی می کردند که حداقل نیازمند یک میلیارد تومان بودجه و 2سال زمان باشد. ازسوی دیگر ما پیکرههای متنی آموزشی ایجاد کردیم که در عین حال که به صورت آزاد منتشر شد موجب ارتقای کیفی موتور ترجمه ما نسبت به همه موتورهای موجود آن زمان شد.
یکی از ویژگی های محصول ما این بود که وابسته به بودجه دولتی نماندیم. درواقع «ترگمان» یکی از معدود پروژههای برگرفته از بودجه دولتی است که توانسته در عرصه تجاری موفق شود و وابسته نماند. ما عملا در «ترگمان» ثابت کردیم که ایرانی با کالای ایرانی عناد ندارد و در صورت ارائه خدمت باکیفیت، حاضر است به جای کالای رایگان، معروف و در دسترس خارجی، از کالای ایرانی استفاده کند حتی اگر مجبور باشد برای آن هزینه ای هم پرداخت کند.
به دنبال تلاش های انجام شده، با وجود موانع و مشکلات موجود در زمینه صادرات هم موفق عمل کردیم. در حالی که در بسیاری از عرصههای علمی، واردکننده و مصرفکننده هستیم اما ما توانستیم فناوری (نه فقط محصول) خود را به ژاپن، روسیه و اخیرا هم ترکیه صادر کنیم.
به طور کلی معتقدم اگر میخواهیم در حوزه فناوری موفق باشیم و به مردم خدمترسانی کنیم، یک شاه کلید موفقیت وجود دارد. با تکیه بر توانمندیهای داخلی و بهرهگیری صحیح از منابع، میتوانیم با غولهای فناوری رقابت کنیم. در این مسیر هیچ نیازی به پول نفت، فیلتر و مسدود سازی و محدود کردن رقبای خارجی نداریم.
در ترجمه ماشینی،تکلیف مالکیت معنوی و کپی رایت چه می شود؟
بحث مالکیت معنوی از جمله چالشهای بسیار مهمی است که متأسفانه در قوانین ما چندان به آن پرداخته نشده است. در همین راستا یکی از کارهایی که در کارگروه حکمرانی داده کمیسیون هوش مصنوعی و علم داده سازمان نصر در حال پیگیری هستیم تبیین ادبیات موضوع در میان قانونگذاران و حاکمان است تا از این طریق بتوانیم چالشهای بسیار زیاد این حوزه را سامان بخشیم.
همین مهم در بحث ترجمه ماشینی نیز با چالش های متعددی مواجه است و مباحث مختلفی را با همکاری انجمن صنفی مترجمان تهران در حال پیگیری هستیم.به هر حال مسلم است که بدون رعایت حقوق مالکیت معنوی و حقوق مالکیت فکری، عملا هیچ پیشرفت و توسعه ای قابل تصور نیست و اگر به این موارد توجه نشود، محکوم به شکست است.
ترجمه ماشینی چه مزیتی به ترجمه انسانی دارد و اصولا چرا ضرورت آن احساس می شود؟
با توجه به رشد روزافزون فناوری و افزایش بیشمار حجم مطالب، عملا نمیتوان انتظار داشت انسان با همه محدودیتهایی که دارد بتواند این مطالب را به زبانهای دیگر ترجمه کند که همین موضوع، لزوم استفاده از ماشینها در این حوزه را نشان میدهد.
ازسوی دیگر مطابق استانداردها یک مترجم حرفهای انسانی در یک روز کاری ۸ ساعته، تنها توانایی ترجمه ۲۵۰۰ تا ۳۵۰۰ کلمه یک متن را دارد. مجموع مترجمان انسانی در سطح دنیا کمتر از نیم میلیون نفر است و درنتیجه، طبیعی است که نمیتوان انتظار داشت حجم انبوه مطالب، پیامها، پستها و ... که به صورت روزافزون در حال تولید است توسط انسان ها ترجمه شود. این درحالی است که ترجمه ماشینی، این امکان را میدهد که وابسته به کیفیت مورد انتظار، حتی به سرعت ترجمه «برخط» رسید.
درحال حاضر در سامانه ترنج«ترجمه نسل جدید» یک ترنج کار نیمه حرفه ای این امکان را دارد که روزانه تا 22هزار کلمه متن را ترجمه کند. طبیعی است که این افزایش حجم کار می تواند موجب کاهش چشمگیر هزینه های ترجمه برای مصرف کننده نهایی شود.
چه چشم اندازی برای هوش مصنوعی در ایران به طور کلی و حوزه تخصصی تان به صورت ویژه دارید؟
خوشبختانه در حوزه هوش مصنوعی در سالهای گذشته پیشرفتهای بسیار خوبی را شاهد بودهایم و بعضا حتی محصولات هوش مصنوعی ایرانی توانستهاند با وجود تحریمها و مشکلات موجود به کشورهای مختلف صادر شوند. یکی از افتخارات ما در شرکت «ترگمان» این بوده است که توانستهایم موتور ترجمه ماشینی را به مهد فناوری دنیا یعنی کشور ژاپن صادر کنیم و موتور تخصصی ترجمه ژاپنی - انگلیسی را به سفارش یک شرکت ژاپنی وابسته به دولت ژاپن، توسعه دهیم.
در حوزه هوش مصنوعی، این امکان وجود دارد که محدودیتها به فرصت تبدیل شوند و رقابت در حوزههای نوظهور انجام شود. در حال حاضر در حوزه ترجمه ماشینی با وجود تمامی پیشرفتهایی که شرکتهایی بزرگ دنیا داشتهاند کماکان جا برای کار بالاخص برای کشورهای منطقه وجود دارد و هماکنون ما سرمایهگذاری برای مقاصد صادراتی منطقه خاورمیانه و کشورهای مشترکالمنافع را آغاز کردهایم.
چه مشکلاتی سر راه توسعه این فناوری در ایران وجود دارد؟
مهمترین چالشی که در سر راه توسعه هوش مصنوعی در کشور گریبان اکثر شرکتها را گرفته، مساله دسترسی به منابع پردازشی و منابع آموزشی است. با توجه به قیمت ارز و مسایل مربوط به تحریمها، بهرهبرداری از زیرساختهای خارجی بسیار گران و پیچیده بوده و در عین حال تامین داخلی این زیرساختها برای شرکتها مقرون به صرفه نیست. این مهم، حمایت دولتی را میطلبد تا با در اختیار گذاشتن زیرساختهای لازم، زمینه تحول و رشد پرشتاب هوش مصنوعی در کشور را فراهم کند.
در دانشگاه ها چقدر به رشته ترجمه ماشینی اهمیت داده می شود؟
در دنیا دانشگاههای متعددی در آلمان، آمریکا، ایتالیا و ... رشتههای تخصصی ترجمه ماشینی دارند.در ایران نیز در مبحث پردازش زبان طبیعی، به ترجمه ماشینی پرداخته میشود و دانشجویان ارشد و دکترای زیادی به تحقیق در این حوزه میپردازند. همچنین در سالهای اخیر برخی از اساتید رشتههای مترجمی و زبان نیز به این حوزه علاقمند شدهاند و تحقیقاتی در این خصوص به عمل آمده است. علاوه بر آن، رشته زبانشناسی رایانشی که یک رشته میان رشتهای علومانسانی و رایانه محسوب میشود هم ایجاد شده است که بخشی از آن، به ترجمه ماشینی اختصاص دارد.
میترا جلیلی