هوش مصنوعی روزبهروز پیشرفتهتر میشود و این فناوری میتواند به ابزاری کاربردی برای تولیدکنندگان محتوا تبدیل شود.
محققان ادوبی و دانشگاه ملی استرالیا، با استفاده از مجموعه دادههای بزرگ برای آموزش الگوریتم یادگیری ماشینی، فناوری جذابی را توسعه دادهاند که عملکرد شگفتانگیزی در تولید مدلهای سهبعدی دارد. محققان اولین مدل بازسازی بزرگ (LRM) را ایجاد کردند که میتواند شکل مدل سهبعدی را از روی تصویر دوبعدی پیشبینی کند و اینکار را فقط در مدت پنج ثانیه انجام میدهد.
محققان در مقالهی خود توضیح میدهند نسل قبلی الگوریتمهای ساخت مدل سهبعدی، براساس مجموعه دادههای متمرکز بر تصویر در مقایس کوچک آموزش داده شدهاند. اکنون مدل LRM از معماری بسیار مقیاسپذیر و مبتنیبر ترانسفورماتور با بیشاز ۵۰۰ میلیون پارامتر آموزش داده شده و از یک میلیون شکل سهبعدی موجود در دادههای Objaverse و MVImgNet بهره میبرد.
محققان میگویند مدل LRM میتواند بازسازیهای سهبعدی با کیفیت را از عکسهای مختلف ازجمله تصاویر دنیای واقعی تولید کند. علاوهبر این، مدل مذکور میتواند تصاویر عادی ساختهشده با سایر سرویسهای هوش مصنوعی مثل DALL-E و میدجورنی را بهعنوان مدل دوبعدی ورودی دریافت کند.
یوکان هانگ، نویسندهی اصلی مقالهی LRM میگوید این مدل پیشرفت مهمی در بازسازی سهبعدی از روی تصاویر ساده است. الگوریتم هوش مصنوعی میتواند هندسهی دقیق را از ویدیو یا تصویر شکل موردنظر، ایجاد و بافتهای پیچیده مثل دانههای چوب را روی آنها حفظ کند.
به گزارش زومیت، LRM میتواند در طیف گستردهای از صنایع ازجمله طراحی، سرگرمی و بازی مورد استفاده قرار گیرد. طراحان میتوانند مدلسازی سهبعدی را راحتتر بسازند و بهمیزان قابل توجهی در زمان خود برای ساخت مدلهای مخصوص بازیهای ویدیویی یا انیمیشنها صرفهجویی کنند.
تولید محتوای سهبعدی در صنعتی که بهسرعت در حال تحول است، به چالش مهمی تبدیل شده و شرکتهای هوش مصنوعی سعی دارند هرچه زودتر، راهکارهای بالقوهای مثل سرویس Stable 3D که Stability AI اخیراً معرفی کرد، ارائه دهند.
LRM این امکان را فراهم میکند کاربران عادی بتوانند مدلهای سهبعدی بسیار دقیقی از عکسهای گرفتهشده با دوربین موجود روی گوشی هوشمند خود بسازند. اگرچه LRM هنوز با چالشهایی مثل بافتهای تار مواجه است، اما دنیای پُر از فرصتهای خلاقانه را روی افراد و کسبوکارها باز میکند.