هوش مصنوعی o1 قدرت استدلال و حل مسائل پیچیده را دارد و حتی میتواند سوالات المپیاد ریاضی را حل کند.
OpenAI مدل هوش مصنوعی جدیدی به نام o1 با قابلیت استدلال و پاسخگویی به مسائل پیچیده با سرعتی بیشتر از انسان را رونمایی کرد که همان توتفرنگی (Strawberry) مورد انتظار است. این مدل بههمراه نسخهای کوچکتر و ارزانتر موسومبه o1-mini منتشر میشود.
بهگفتهی OpenAI، مدل o1 نمایانگر گام جدیدی بهسوی دستیابی به هوش مصنوعی انسانگونه است. این مدل عملکرد بهتری در زمینهی کدنویسی، حل مسائل ریاضی و استدلال چندمرحلهای نسبتبه مدلهای قبلی ارائه میدهد.
درحالحاضر، استفاده از o1 در مقایسهبا GPT-4o هزینهی بیشتری برای کاربر دارد و با تأخیر طولانیتری در پاسخگویی همراه است. OpenAI نام این نسخه از o1 را Preview گذاشته است تا بر نوظهور بودن آن تأکید کند.
کاربران ChatGPT Plus و Team از هماکنون به هر دو مدل o1-preview و o1-mini دسترسی دارند و کاربران Enterprise و Edu بهزودی به آن دسترسی خواهند داشت. OpenAI قصد دارد که دسترسی به o1-mini را به تمامی کاربران رایگان ChatGPT ارائه کند، اما هنوز تاریخی برای انتشار آن تعیین نکرده است.
دسترسی به API نسخهی o1-preview بهازای هر یک میلیون توکن ورودی، ۱۵ دلار و به ازای هر یک میلیون توکن خروجی ۶۰ دلار هزینه دارد. برای مقایسه، GPT-4o بهازای هر یک میلیون توکن ورودی، ۵ دلار و برای هر یک میلیون توکن خروجی ۱۵ دلار هزینه دارد.
OpenAI رابط کاربری Strawberry را به گونهای طراحی کرده است که مراحل استدلال را با جملات انسانگونهای در حین پردازش و تولید پاسخ نمایش دهد. بهعنوان مثال، مدل o1 زمان محدودی برای پردازش درخواست دارد، بنابراین ممکن است بگوید: «اوه، وقت من دارد تمام میشود، باید سریع به پاسخ برسم.»
جری توورک، مسئول تحقیقات OpenAI بهورج میگوید: «o1 با استفاده از الگوریتم بهینهسازی کاملاً جدیدی توسعه یافته و با استفاده از منابع اطلاعاتی که بهطور خاص برای آن طراحی شده، آموزش دیده است.»
بنا به گفته زومیت نتیجهی روش آموزشی جدید، احتمالاً منجر به دقت و توانایی تجزیهوتحلیل بیشتری در مدل o1 خواهد شد. توورک میگوید: «ما متوجه شدهایم که این مدل کمتر دچار توهم و خطا میشود، اما مشکل هنوز هم وجود دارد و نمیتوانیم بگوییم که توهمات را بهطور کامل حل کردهایم.»
OpenAI مدل o1 را در برابر یک امتحان المپیاد ریاضی بینالمللی مورد آزمایش قرار داد و درحالی که GPT-4o تنها ۱۳ درصد مسائل را بهدرستی حل کرد، o1 توانست امتیاز ۸۳ درصدی را کسب کند.
در مسابقات برنامهنویسی آنلاین موسومبه Codeforces، مدل o1-preview در بین ۱۱ درصد برتر شرکتکنندگان قرار گرفت. OpenAI ادعا میکند که بهروزرسانی بعدی این مدل «همسطح دانشجویان دکترا در مسائل چالشبرانگیز فیزیک، شیمی و بیولوژی عمل خواهد کرد.»
درعینحال، o1 در بسیاری از زمینهها به اندازهی GPT-4o توانمند نیست. این مدل در زمینهی اطلاعات واقعی دربارهی جهان، عملکرد مطلوبی نشان نمیدهد. همچنین توانایی مرور وب یا پردازش فایلها و تصاویر را ندارد.
کد خبر ۲۱۲۰۳۰۶۲۵.۵۶۹.۱