گوگل قابلیت کنترل کامل صفحه‌نمایش را به Gemini 3.5 Flash اضافه کرد

انتشار: 6 تیر 1405

گوگل قابلیت Computer Use را به‌صورت یک ابزار داخلی به مدل Gemini 3.5 Flash اضافه کرده است؛ قابلیتی که به عامل‌های هوش مصنوعی اجازه می‌دهد صفحه‌نمایش را مشاهده کنند، روی دکمه‌ها کلیک کنند، متن تایپ کنند، اسکرول کنند و در مرورگر، موبایل یا رایانه وظایف مختلف را به‌صورت خودکار انجام دهند.

پیش از این، توسعه‌دهندگان برای استفاده از این قابلیت باید از یک مدل جداگانه استفاده می‌کردند، اما اکنون همه این امکانات مستقیماً از طریق Gemini API و پلتفرم Gemini Enterprise Agent Platform در دسترس قرار گرفته است. این یکپارچه‌سازی ساخت عامل‌های هوش مصنوعی برای انجام کارهای چندمرحله‌ای، آزمایش خودکار نرم‌افزار، تکمیل فرم‌ها و استخراج اطلاعات را ساده‌تر می‌کند.

گوگل هم‌زمان تمرکز ویژه‌ای بر امنیت داشته و اعلام کرده است که Gemini 3.5 Flash در برابر حملات «تزریق پرامپت» آموزش دیده است. همچنین دو قابلیت امنیتی اختیاری برای کاربران سازمانی ارائه شده که اجرای عملیات حساس را تنها با تأیید کاربر انجام می‌دهد یا در صورت تشخیص حمله، فعالیت عامل هوش مصنوعی را متوقف می‌کند.

گوگل معتقد است افزودن قابلیت کنترل صفحه‌نمایش به سریع‌ترین مدل عامل‌محور خود، گام مهمی در توسعه اتوماسیون سازمانی است؛ هرچند این شرکت تأکید می‌کند که این فناوری هنوز برای اجرای کاملاً بدون نظارت انسان آماده نیست و در مواجهه با مواردی مانند CAPTCHA یا رابط‌های کاربری غیرمنتظره همچنان با محدودیت‌هایی روبه‌رو است.

کد خبر ۲۱۲۰۵۰۴۰۶.۵۲۲

منبع:نکس وب