پژوهشگران مؤسسه هوش مصنوعی دانشگاه پکن با معرفی یک روش نوین آموزشی به نام MotionCutMix، گامی مهم در جهت آموزش هوش مصنوعی برای ویرایش حرکات سهبعدی انسان بر اساس ورودی متنی برداشتند.
این فناوری پیشرفته، توانایی بازآفرینی دقیق و واقعگرایانه حرکات انسانی را دارد؛ قابلیتی که میتواند در حوزههایی همچون توسعه بازیهای رایانهای، انیمیشنسازی، تجربههای واقعیت مجازی (VR) و حتی تولید ویدئوهای آموزشی در زمینههایی مانند بهداشت، ورزش و امدادرسانی بسیار مؤثر باشد.
در همین راستا، تیم تحقیقاتی دانشگاه پکن و آزمایشگاه ملی هوش مصنوعی عمومی چین، مدلهای جدیدی را طراحی کردهاند که قادر به سادهسازی و ویرایش طیف گستردهای از حرکات انسانی برای شخصیتهای دیجیتال و آواتارها هستند.
این دستاورد علمی در کنفرانس بینالمللی بینایی رایانه و تشخیص الگو (CVPR 2025) معرفی شد. به گفته دکتر ییشین جو، نویسنده ارشد مقاله، هرچند تولید حرکات انسانی با کمک هوش مصنوعی پیشرفت زیادی داشته، اما امکان ویرایش دقیق حرکات موجود هنوز بسیار محدود باقی مانده بود.
به همین دلیل، این تیم پژوهشی سیستمی را طراحی کرده است که تنها با دریافت دستورهای نوشتاری ساده، بدون نیاز به مشخصکردن دقیق بخشهای بدن یا اطلاعات خاص برای هر وظیفه، بتواند حرکات انسانی را هم از نظر فضایی (برای بخشهایی از بدن) و هم زمانی (در طول حرکت) ویرایش کند.
در روش MotionCutMix، بخشهایی از بدن مانند بازو، پا یا تنه از یک توالی حرکتی انتخاب شده و به صورت ترکیبی با توالی حرکتی دیگری ادغام میشوند. برخلاف روشهای قدیمی که منجر به حرکات غیرطبیعی یا پرتلاطم میشدند، این روش با ایجاد انتقالهای نرم و پیوسته، حرکاتی طبیعی و روان تولید میکند.
از دیگر مزایای این روش، تولید خودکار دادههای آموزشی متنوع است که نیاز به برچسبگذاری دستی را به حداقل میرساند. با این کار، مدل میتواند از محتوای بدون برچسب در سطح اینترنت نیز بهرهبرداری کند و میلیونها نمونه آموزشی جدید تنها از طریق ترکیبهای مختلف حرکات و بخشهای بدن تولید کند.
این سیستم در عین پیچیدگی، از نظر کارایی نیز بسیار بهینه طراحی شده است و با بهرهگیری از ماسکگذاری نرم و هماهنگی بین اجزای بدن، حرکاتی واقعگرایانه و بدون اختلال ارائه میدهد.
کد خبر ۲۱۲۰۴۰۱۲۶.۰۲۷
منبع: اینترستینگ اینجیرینگ