مدل جدید OpenAI به نام O3-mini توانسته در تستهای مختلف عملکردی بهتر از مدلهای قبلی این شرکت مانند R1 و O1 ارائه دهد، هرچند که در برخی زمینهها هنوز اختلاف کمی با آنها دارد. در آزمون AIME 2024 که توانایی مدلها در درک و پاسخ به دستورات پیچیده را میسنجند، O3-mini در تلاشهای منطقی بالا موفق به شکست R1 شده است.
همچنین در آزمون SWE-bench Verified که بر برنامهنویسی متمرکز است، با اختلاف کمی (۰.۱ امتیاز) از R1 پیشی میگیرد.
O3-mini در مقایسه با مدلهای O1 عملکردی مشابه با سرعت پاسخدهی بالاتر و هزینه کمتر دارد، بهویژه در سطح تلاش منطقی متوسط. با این حال، در برخی آزمونها مانند GPQA Diamond که به سوالات پیچیده فیزیک، زیستشناسی و شیمی میپردازد، مدل O3-mini نتواسته از مدل O1 پیشی بگیرد.
نکته قابل توجه دیگر، تاکید OpenAI بر ایمنی بالای مدل O3-mini است. این مدل با استفاده از روشهای جدید نظارتی و امنیتی، از جمله «همراستایی تدبیرانه»، توانسته در آزمایشهای سختگیرانهتر ایمنی بهتر از مدلهای قبلی مانند GPT-4o از خود نشان دهد.
کد خبر ۲۱۲۰۳۱۱۱۳.۰۲۶
منبع: تک کرانچ
3 دیدگاه در “مدل جدید اپن ای آی O3-mini، پیشرفتهای چشمگیر در آزمونها و برتری در ایمنی”
Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
Thanks for sharing. I read many of your blog posts, cool, your blog is very good.
Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.