انویدیا نخستین مدل استدلالی متن‌باز برای خودروهای خودران را معرفی کرد

انتشار: 12 آذر 1404

انویدیا با یک اقدام جسورانه در جریان کنفرانس معتبر NeurIPS، نسل جدیدی از مدل‌های هوش مصنوعی «فیزیکی و دیجیتال» را معرفی کرد؛ مدل‌هایی که می‌توانند آینده خودروهای خودران، رباتیک و پردازش گفتار را دگرگون کنند.

در مرکز این معرفی‌ها، مدل Alpamayo-R1 (AR1) قرار دارد؛ اولین مدل متن‌باز Vision-Language-Action با توانایی استدلال زنجیره‌ای که به‌طور ویژه برای خودروهای خودران طراحی شده است. این مدل با تجزیه هر سناریو، ارزیابی مسیرهای ممکن و انتخاب امن‌ترین گزینه، می‌تواند تقاطع‌های شلوغ، خودروهای دوبله پارک‌شده یا بستن ناگهانی خطوط را با قضاوتی نزدیک به انسان مدیریت کند.

این مدل بر پایه «Cosmos Reason» توسعه یافته و به‌صورت متن‌باز در GitHub و Hugging Face در دسترس پژوهشگران قرار دارد. انویدیا اعلام کرده که نسخه تقویت‌شده با یادگیری تقویتی پس‌آموزش نسبت به نسخه اولیه قدرت استدلال به‌مراتب بالاتری نشان می‌دهد.

انویدیا علاوه‌بر AR1، مجموعه ابزارهای Cosmos را نیز عرضه کرده که طیف وسیعی از نیازهای رباتیک و هوش مصنوعی فیزیکی را پوشش می‌دهد؛ از ابزار LidarGen برای تولید داده‌های شبیه‌سازی لیدار، تا Cosmos Policy برای تدوین قوانین رفتاری ربات‌ها و ProtoMotions3 برای آموزش ربات‌های انسان‌نما در محیط‌های واقعی‌سازی‌شده.

پژوهشگران و شرکت‌های فعال در حوزه خودروهای خودران – از جمله Voxel51، Figure AI و Gatik – هم‌اکنون در حال استفاده از این مدل‌ها هستند. دانشگاه ETH Zurich نیز از Cosmos برای ساخت صحنه‌های سه‌بعدی بهره برده است.

در بخش «هوش مصنوعی دیجیتال»، انویدیا مجموعه Nemotron را نیز ارتقا داده است. از مهم‌ترین نوآوری‌ها می‌توان به MultiTalker Parakeet برای تشخیص گفتار چندگوینده، مدل Sortformer برای تفکیک لحظه‌ای صدای افراد، و Audio Flamingo 3 – مدل زبانی صوتی بزرگ با توان استدلال روی گفتار، موسیقی و صدا – اشاره کرد.
همچنین مدل Minitron-SSM امکان فشرده‌سازی مدل‌ها بدون افت کیفیت را فراهم می‌کند.

انویدیا در کنار این‌ها نسخه‌های بهینه‌شده Jet-Nemotron و Nemotron-Flash را برای پردازش سریع و کم‌تأخیر مدل‌های زبانی معرفی کرد. شرکت اعلام کرده تکنیک ProRL یا «یادگیری تقویتی طولانی‌مدت» نقش کلیدی در بهبود دائمی توان استدلال مدل‌ها داشته است.

با این مجموعه گسترده از ابزارهای متن‌باز، انویدیا گام بزرگی در democratization هوش مصنوعی برداشته و به پژوهشگران و توسعه‌دهندگان امکان داده که نسل آینده سیستم‌های خودران، ربات‌ها و مدل‌های صوتی را سریع‌تر و آزادانه‌تر توسعه دهند.

کد خبر ۲۰۳۰۴۰۹۱۲.۰۲۷

منبع: اینترستینگ اینجیرینگ