گوگل از مدل هوش مصنوعی RT-2 برای حرف زدن با ربات‌ها رونمایی کرد

انتشار: 7 مرداد 1402
کد خبر: 213020507-560

چت‌بات‌های هوش مصنوعی که از مدل‌های زبان بزرگ (LLM) تشکیل شده‌اند، مانند ChatGPT و Bard در چند وقت گذشته مورد توجه بسیار زیادی قرار گرفته‌اند و حوزه رباتیک نیز سال‌هاست که به‌طور فعال در حال بررسی بوده است. حالا گوگل با یک مدل هوش مصنوعی جدید از پیشرفت دیگری در این حوزه خبر داده است.
به گفته ی دیجیاتو گوگل از مدل هوش مصنوعی جدیدی با نامRobotics Transformer 2 (RT-2) رونمایی کرده که هدف بسیار خاصی دارد: برقراری ارتباط با یک ربات. مدل غول فناوری برای رسیدن به هدف خود از تکنیک‌های جدیدی استفاده می‌کند که توسط یک عمل بصری-زبان (VLA) منحصر‌به‌فرد طراحی شده که گوگل مدعی شده در نوع خود اولین است.
هدف RT-2 کاهش شکاف بین واقعیت و تخیل است با اطمینان از اینکه ربات‌ها به‌طور کامل بتوانند دنیای اطراف خود را درک کنند. در اصل، عملکرد این مدل بسیار شبیه به LLM است و از یک مدل مبتنی بر ترانسفورماتور استفاده می‌کند تا بتواند اطلاعات متنی و بصری موجود در وب جهان را درک کند و سپس آن‌ها را به فعالیت‌های رباتیک تبدیل کنند، حتی در مواردی که آموزش داده نشده است.
گوگل درباره موارد استفاده از قابلیت RT-2 به چند مورد اشاره کرده است.
به‌عنوان مثال، اگر از یک ربات مجهز به RT-2 بخواهید زباله‌ها را در سطل زباله بیندازد، به‌راحتی می‌تواند بفهمد زباله چیست، چگونه آن را از سایر اشیاء تشخیص دهد و چگونه آن را در سطل بیندازد، بدون اینکه در مورد هر یک از این فعالیت‌ها آموزش دیده باشد.
آزمایش‌های غول فناوری همچنین نتایج نسبتاً چشمگیری به همراه داشته است.
به گفته گوگل، RT-2 در بیش از ۶۰۰۰ تست خود ثابت کرد که در کارهای مربوط به «دیدن» به اندازه نمونه قبلی خود توانا است. جالب‌تر اینکه در فعالیت‌های دیگر، مدل جدید امتیاز ۶۲ را کسب کرده است که در مقایسه با RT-1 با امتیاز ۳۲، تقریباً دو برابر شاهد بهبود عملکرد بوده است.