انویدیا با یک اقدام جسورانه در جریان کنفرانس معتبر NeurIPS، نسل جدیدی از مدلهای هوش مصنوعی «فیزیکی و دیجیتال» را معرفی کرد؛ مدلهایی که میتوانند آینده خودروهای خودران، رباتیک و پردازش گفتار را دگرگون کنند.
در مرکز این معرفیها، مدل Alpamayo-R1 (AR1) قرار دارد؛ اولین مدل متنباز Vision-Language-Action با توانایی استدلال زنجیرهای که بهطور ویژه برای خودروهای خودران طراحی شده است. این مدل با تجزیه هر سناریو، ارزیابی مسیرهای ممکن و انتخاب امنترین گزینه، میتواند تقاطعهای شلوغ، خودروهای دوبله پارکشده یا بستن ناگهانی خطوط را با قضاوتی نزدیک به انسان مدیریت کند.
این مدل بر پایه «Cosmos Reason» توسعه یافته و بهصورت متنباز در GitHub و Hugging Face در دسترس پژوهشگران قرار دارد. انویدیا اعلام کرده که نسخه تقویتشده با یادگیری تقویتی پسآموزش نسبت به نسخه اولیه قدرت استدلال بهمراتب بالاتری نشان میدهد.
انویدیا علاوهبر AR1، مجموعه ابزارهای Cosmos را نیز عرضه کرده که طیف وسیعی از نیازهای رباتیک و هوش مصنوعی فیزیکی را پوشش میدهد؛ از ابزار LidarGen برای تولید دادههای شبیهسازی لیدار، تا Cosmos Policy برای تدوین قوانین رفتاری رباتها و ProtoMotions3 برای آموزش رباتهای انساننما در محیطهای واقعیسازیشده.
پژوهشگران و شرکتهای فعال در حوزه خودروهای خودران – از جمله Voxel51، Figure AI و Gatik – هماکنون در حال استفاده از این مدلها هستند. دانشگاه ETH Zurich نیز از Cosmos برای ساخت صحنههای سهبعدی بهره برده است.
در بخش «هوش مصنوعی دیجیتال»، انویدیا مجموعه Nemotron را نیز ارتقا داده است. از مهمترین نوآوریها میتوان به MultiTalker Parakeet برای تشخیص گفتار چندگوینده، مدل Sortformer برای تفکیک لحظهای صدای افراد، و Audio Flamingo 3 – مدل زبانی صوتی بزرگ با توان استدلال روی گفتار، موسیقی و صدا – اشاره کرد.
همچنین مدل Minitron-SSM امکان فشردهسازی مدلها بدون افت کیفیت را فراهم میکند.
انویدیا در کنار اینها نسخههای بهینهشده Jet-Nemotron و Nemotron-Flash را برای پردازش سریع و کمتأخیر مدلهای زبانی معرفی کرد. شرکت اعلام کرده تکنیک ProRL یا «یادگیری تقویتی طولانیمدت» نقش کلیدی در بهبود دائمی توان استدلال مدلها داشته است.
با این مجموعه گسترده از ابزارهای متنباز، انویدیا گام بزرگی در democratization هوش مصنوعی برداشته و به پژوهشگران و توسعهدهندگان امکان داده که نسل آینده سیستمهای خودران، رباتها و مدلهای صوتی را سریعتر و آزادانهتر توسعه دهند.
کد خبر ۲۰۳۰۴۰۹۱۲.۰۲۷
منبع: اینترستینگ اینجیرینگ