چتباتهای هوش مصنوعی که از مدلهای زبان بزرگ (LLM) تشکیل شدهاند، مانند ChatGPT و Bard در چند وقت گذشته مورد توجه بسیار زیادی قرار گرفتهاند و حوزه رباتیک نیز سالهاست که بهطور فعال در حال بررسی بوده است. حالا گوگل با یک مدل هوش مصنوعی جدید از پیشرفت دیگری در این حوزه خبر داده است.
به گفته ی دیجیاتو گوگل از مدل هوش مصنوعی جدیدی با نامRobotics Transformer 2 (RT-2) رونمایی کرده که هدف بسیار خاصی دارد: برقراری ارتباط با یک ربات. مدل غول فناوری برای رسیدن به هدف خود از تکنیکهای جدیدی استفاده میکند که توسط یک عمل بصری-زبان (VLA) منحصربهفرد طراحی شده که گوگل مدعی شده در نوع خود اولین است.
هدف RT-2 کاهش شکاف بین واقعیت و تخیل است با اطمینان از اینکه رباتها بهطور کامل بتوانند دنیای اطراف خود را درک کنند. در اصل، عملکرد این مدل بسیار شبیه به LLM است و از یک مدل مبتنی بر ترانسفورماتور استفاده میکند تا بتواند اطلاعات متنی و بصری موجود در وب جهان را درک کند و سپس آنها را به فعالیتهای رباتیک تبدیل کنند، حتی در مواردی که آموزش داده نشده است.
گوگل درباره موارد استفاده از قابلیت RT-2 به چند مورد اشاره کرده است.
بهعنوان مثال، اگر از یک ربات مجهز به RT-2 بخواهید زبالهها را در سطل زباله بیندازد، بهراحتی میتواند بفهمد زباله چیست، چگونه آن را از سایر اشیاء تشخیص دهد و چگونه آن را در سطل بیندازد، بدون اینکه در مورد هر یک از این فعالیتها آموزش دیده باشد.
آزمایشهای غول فناوری همچنین نتایج نسبتاً چشمگیری به همراه داشته است.
به گفته گوگل، RT-2 در بیش از ۶۰۰۰ تست خود ثابت کرد که در کارهای مربوط به «دیدن» به اندازه نمونه قبلی خود توانا است. جالبتر اینکه در فعالیتهای دیگر، مدل جدید امتیاز ۶۲ را کسب کرده است که در مقایسه با RT-1 با امتیاز ۳۲، تقریباً دو برابر شاهد بهبود عملکرد بوده است.