مدل جدید OpenAI با نام o3 حالا میتواند مکان دقیق عکسها را با دقتی خیرهکننده حدس بزند؛ قابلیتی که به گفته این شرکت، یک «پیشرفت چشمگیر در درک بصری» به حساب میآید.
کاربران شبکههای اجتماعی از این ویژگی حیرتزده شدهاند. در تستهای اولیه، افراد عکسهایی از مکانهای مختلف—حتی بدون نشانههای واضح—را به ChatGPT دادهاند و این هوش مصنوعی با تحلیل سرنخهای تصویری، مکان دقیق آن را در زمانی کوتاه حدس زده است. برای مثال، یک عکس ساده از برچسب کتاب باعث شد که مدل مکان آن را بهدرستی در «دانشگاه ملبورن» تشخیص دهد!
در آزمایش دیگری، ChatGPT موفق شد تنها با یک تصویر معمولی از یک خانه در سورینام (که ممکن است از Google Earth گرفته شده باشد) محل دقیق آن را تشخیص دهد.
مدل o3 حتی در نمایشگاه بینالمللی خودروی نیویورک ۲۰۲۵، عکس جدیدترین خودرو الکتریکی سوبارو را با تحلیل دقیق و تطبیق آن با طراحی غرفه و نورپردازی، بهدرستی به مکان دقیق در مرکز جِیوِتس منهتن نسبت داد.
این قابلیت صرفاً به تشخیص مکان محدود نیست؛ ChatGPT همچنین میتواند تصاویر ناقص را بازسازی کند، مثلاً نوشتهای وارونه روی دفتر را بخواند یا اجزای تصویر را جابهجا کرده و اطلاعات را استخراج کند.
البته OpenAI تأکید دارد که هنوز خطاهای دیداری در برخی موارد ممکن است باعث پاسخ اشتباه شود. بههمیندلیل، تدابیری برای جلوگیری از سوءاستفاده و حفظ حریم خصوصی در مدل گنجانده شده است.
کاربردهای بالقوه این قابلیت شامل امداد در بلایای طبیعی، پژوهشهای علمی، افزایش دسترسی افراد کمتوان و تشخیص سریع مکانها در بحرانها است—هرچند نگرانیهایی درباره احتمال استفادههای نادرست توسط نهادهای نظارتی و افراد سودجو نیز مطرح شده است.
کد خبر ۲۱۲۰۴۰۱۳۱.۷۷۳
منبع: پی سی مگ