هوش مصنوعی جدید اوپن‌ای‌آی قدرت استدلال ریاضی و علمی دارد

انتشار: 25 شهریور 1403

هوش مصنوعی o1 قدرت استدلال و حل مسائل پیچیده را دارد و حتی می‌تواند سوالات المپیاد ریاضی را حل کند.

OpenAI مدل هوش مصنوعی جدیدی به نام o1 با قابلیت استدلال و پاسخ‌گویی به مسائل پیچیده با سرعتی بیشتر از انسان را رونمایی کرد که همان توت‌فرنگی (Strawberry) مورد انتظار است. این مدل به‌همراه نسخه‌ای کوچک‌تر و ارزان‌تر موسوم‌به o1-mini منتشر می‌شود.

به‌گفته‌ی OpenAI، مدل o1 نمایانگر گام جدیدی به‌سوی دستیابی به هوش مصنوعی انسا‌ن‌گونه است. این مدل عملکرد بهتری در زمینه‌ی کدنویسی، حل مسائل ریاضی و استدلال چندمرحله‌ای نسبت‌به مدل‌های قبلی ارائه می‌دهد.

درحال‌حاضر، استفاده از o1 در مقایسه‌با GPT-4o هزینه‌ی بیشتری برای کاربر دارد و با تأخیر طولانی‌تری در پاسخ‌گویی همراه است. OpenAI نام این نسخه از o1 را Preview گذاشته است تا بر نوظهور بودن آن تأکید کند.

کاربران ChatGPT Plus و Team از هم‌اکنون به هر دو مدل o1-preview و o1-mini دسترسی دارند و کاربران Enterprise و Edu به‌زودی به آن دسترسی خواهند داشت. OpenAI قصد دارد که دسترسی به o1-mini را به تمامی کاربران رایگان ChatGPT ارائه کند، اما هنوز تاریخی برای انتشار آن تعیین نکرده است.

دسترسی به API نسخه‌ی o1-preview به‌ازای هر یک میلیون توکن ورودی، ۱۵ دلار و به ازای هر یک میلیون توکن خروجی ۶۰ دلار هزینه دارد. برای مقایسه، GPT-4o به‌ازای هر یک میلیون توکن ورودی، ۵ دلار و برای هر یک میلیون توکن خروجی ۱۵ دلار هزینه دارد.

OpenAI رابط کاربری Strawberry را به گونه‌ای طراحی کرده است که مراحل استدلال را با جملات انسان‌گونه‌ای در حین پردازش و تولید پاسخ نمایش دهد. به‌عنوان مثال، مدل o1 زمان محدودی برای پردازش درخواست دارد، بنابراین ممکن است بگوید: «اوه، وقت من دارد تمام می‌شود، باید سریع به پاسخ برسم.»

جری توورک، مسئول تحقیقات OpenAI به‌ورج می‌گوید: «o1 با استفاده از الگوریتم بهینه‌سازی کاملاً جدیدی توسعه یافته و با استفاده از منابع اطلاعاتی که به‌طور خاص برای آن طراحی شده، آموزش دیده است.»

بنا به گفته زومیت نتیجه‌ی روش آموزشی جدید، احتمالاً منجر به دقت و توانایی تجزیه‌وتحلیل بیشتری در مدل o1 خواهد شد. توورک می‌گوید: «ما متوجه شده‌ایم که این مدل کمتر دچار توهم و خطا می‌شود، اما مشکل هنوز هم وجود دارد و نمی‌توانیم بگوییم که توهمات را به‌طور کامل حل کرده‌ایم.»

OpenAI مدل o1 را در برابر یک امتحان المپیاد ریاضی بین‌المللی مورد آزمایش قرار داد و درحالی که GPT-4o تنها ۱۳ درصد مسائل را به‌درستی حل کرد، o1 توانست امتیاز ۸۳ درصدی را کسب کند.

در مسابقات برنامه‌نویسی آنلاین موسوم‌به Codeforces، مدل o1-preview در بین ۱۱ درصد برتر شرکت‌کنندگان قرار گرفت. OpenAI ادعا می‌کند که به‌روزرسانی بعدی این مدل «هم‌سطح دانشجویان دکترا در مسائل چالش‌برانگیز فیزیک، شیمی و بیولوژی عمل خواهد کرد.»

درعین‌حال، o1 در بسیاری از زمینه‌ها به اندازه‌ی GPT-4o توانمند نیست. این مدل در زمینه‌ی اطلاعات واقعی درباره‌ی جهان، عملکرد مطلوبی نشان نمی‌دهد. همچنین توانایی مرور وب یا پردازش فایل‌ها و تصاویر را ندارد.

کد خبر ۲۱۲۰۳۰۶۲۵.۵۶۹.۱