OpenAI در آخرین روز از رویداد ۱۲ روزه معرفی محصولات و قابلیتهای جدید خود، از مدل هوش مصنوعی استدلالگر o3 رونمایی کرد که ادعا میشود در برخی جنبهها به سطح هوش مصنوعی جامع (AGI) نزدیک شده است. این مدل جانشین o1 است و شامل دو نسخه اصلی به نامهای o3 و o3-mini میشود که نسخه مینی آن سبکتر و کوچکتر است و برای کارهای خاص کاربرد بیشتری دارد.
مدلهای o3 هنوز برای عموم در دسترس نیستند، اما کارشناسان ایمنی میتوانند از امروز برای پیشنمایش o3-mini نامنویسی کنند. پیشنمایش مدل اصلی o3 نیز بهزودی عرضه خواهد شد، هرچند OpenAI هنوز تاریخ دقیق عرضه آن را اعلام نکرده است. «سم آلتمن»، مدیرعامل OpenAI، اعلام کرد که مدل o3-mini اواخر ژانویه در دسترس قرار خواهد گرفت و مدل کامل o3 در آیندهای نزدیک به بازار خواهد آمد.
مدل هوش مصنوعی o3 از یک روش جدید به نام یادگیری تقویتی برای آموزش استفاده میکند و میتواند پیش از ارائه پاسخ، بهصورت گامبهگام و با استفاده از فرایند موسوم به «زنجیره خصوصی تفکر» عمل کند. این قابلیت به o3 این امکان را میدهد که با در نظر گرفتن مجموعهای از گامها، مسائل پیچیده را حل کند.
یکی از ویژگیهای برجسته o3 قابلیت تنظیم زمان استدلال است. این مدل میتواند مدت زمان تفکر را بهطور دلخواه تنظیم کند، چه زمان کوتاه، متوسط یا طولانی. هرچه زمان بیشتری برای تفکر در نظر گرفته شود، مدل قادر خواهد بود بهتر عمل کند.
OpenAI همچنین ادعا کرده که مدل o3 در بنچمارک ARC-AGI به امتیاز ۸۷.۵ درصد دست یافته است که نشاندهنده توانایی این مدل در یادگیری مهارتهای جدید خارج از دادههای آموزشی است. این امتیاز در حالت تفکر طولانی بهدست آمده و نشاندهنده پیشرفت چشمگیر در مسیر دستیابی به AGI است. در مقایسه با مدل قبلی (o1)، o3 در بدترین حالت با زمان تفکر کوتاه، سهبرابر عملکرد بهتری دارد.
OpenAI با این دستاورد جدید گام بزرگی در توسعه مدلهای هوش مصنوعی استدلالگر برداشته است، هرچند هنوز راه زیادی تا تحقق کامل AGI باقی مانده است.
کد خبر ۲۱۲۰۳۱۰۰۱.۰۲۶