پیشرفت جدید چین در ویرایش سه‌بعدی حرکات انسانی با هوش مصنوعی

انتشار: 26 فروردین 1404

پژوهشگران مؤسسه هوش مصنوعی دانشگاه پکن با معرفی یک روش نوین آموزشی به نام MotionCutMix، گامی مهم در جهت آموزش هوش مصنوعی برای ویرایش حرکات سه‌بعدی انسان بر اساس ورودی متنی برداشتند.

این فناوری پیشرفته، توانایی بازآفرینی دقیق و واقع‌گرایانه حرکات انسانی را دارد؛ قابلیتی که می‌تواند در حوزه‌هایی همچون توسعه بازی‌های رایانه‌ای، انیمیشن‌سازی، تجربه‌های واقعیت مجازی (VR) و حتی تولید ویدئوهای آموزشی در زمینه‌هایی مانند بهداشت، ورزش و امدادرسانی بسیار مؤثر باشد.

در همین راستا، تیم تحقیقاتی دانشگاه پکن و آزمایشگاه ملی هوش مصنوعی عمومی چین، مدل‌های جدیدی را طراحی کرده‌اند که قادر به ساده‌سازی و ویرایش طیف گسترده‌ای از حرکات انسانی برای شخصیت‌های دیجیتال و آواتارها هستند.

این دستاورد علمی در کنفرانس بین‌المللی بینایی رایانه و تشخیص الگو (CVPR 2025) معرفی شد. به گفته دکتر ییشین جو، نویسنده ارشد مقاله، هرچند تولید حرکات انسانی با کمک هوش مصنوعی پیشرفت زیادی داشته، اما امکان ویرایش دقیق حرکات موجود هنوز بسیار محدود باقی مانده بود.

به همین دلیل، این تیم پژوهشی سیستمی را طراحی کرده است که تنها با دریافت دستورهای نوشتاری ساده، بدون نیاز به مشخص‌کردن دقیق بخش‌های بدن یا اطلاعات خاص برای هر وظیفه، بتواند حرکات انسانی را هم از نظر فضایی (برای بخش‌هایی از بدن) و هم زمانی (در طول حرکت) ویرایش کند.

در روش MotionCutMix، بخش‌هایی از بدن مانند بازو، پا یا تنه از یک توالی حرکتی انتخاب شده و به صورت ترکیبی با توالی حرکتی دیگری ادغام می‌شوند. برخلاف روش‌های قدیمی که منجر به حرکات غیرطبیعی یا پرتلاطم می‌شدند، این روش با ایجاد انتقال‌های نرم و پیوسته، حرکاتی طبیعی و روان تولید می‌کند.

از دیگر مزایای این روش، تولید خودکار داده‌های آموزشی متنوع است که نیاز به برچسب‌گذاری دستی را به حداقل می‌رساند. با این کار، مدل می‌تواند از محتوای بدون برچسب در سطح اینترنت نیز بهره‌برداری کند و میلیون‌ها نمونه آموزشی جدید تنها از طریق ترکیب‌های مختلف حرکات و بخش‌های بدن تولید کند.

این سیستم در عین پیچیدگی، از نظر کارایی نیز بسیار بهینه طراحی شده است و با بهره‌گیری از ماسک‌گذاری نرم و هماهنگی بین اجزای بدن، حرکاتی واقع‌گرایانه و بدون اختلال ارائه می‌دهد.

کد خبر ۲۱۲۰۴۰۱۲۶.۰۲۷

منبع: اینترستینگ اینجیرینگ