مدل جدید اپن ای آی O3-mini، پیشرفت‌های چشمگیر در آزمون‌ها و برتری در ایمنی

مدل جدید اپن ای آی : اO3-mini، پیشرفت‌های چشمگیر در آزمون‌ها و برتری در ایمنی
فهرست مطالب

مدل جدید OpenAI به نام O3-mini توانسته در تست‌های مختلف عملکردی بهتر از مدل‌های قبلی این شرکت مانند R1 و O1 ارائه دهد، هرچند که در برخی زمینه‌ها هنوز اختلاف کمی با آنها دارد. در آزمون AIME 2024 که توانایی مدل‌ها در درک و پاسخ به دستورات پیچیده را می‌سنجند، O3-mini در تلاش‌های منطقی بالا موفق به شکست R1 شده است.

همچنین در آزمون SWE-bench Verified که بر برنامه‌نویسی متمرکز است، با اختلاف کمی (۰.۱ امتیاز) از R1 پیشی می‌گیرد.

O3-mini در مقایسه با مدل‌های O1 عملکردی مشابه با سرعت پاسخ‌دهی بالاتر و هزینه کمتر دارد، به‌ویژه در سطح تلاش منطقی متوسط. با این حال، در برخی آزمون‌ها مانند GPQA Diamond که به سوالات پیچیده فیزیک، زیست‌شناسی و شیمی می‌پردازد، مدل O3-mini نتواسته از مدل O1 پیشی بگیرد.

نکته قابل توجه دیگر، تاکید OpenAI بر ایمنی بالای مدل O3-mini است. این مدل با استفاده از روش‌های جدید نظارتی و امنیتی، از جمله «هم‌راستایی تدبیرانه»، توانسته در آزمایش‌های سخت‌گیرانه‌تر ایمنی بهتر از مدل‌های قبلی مانند GPT-4o از خود نشان دهد.

کد خبر ۲۱۲۰۳۱۱۱۳.۰۲۶

منبع: تک کرانچ

3 دیدگاه در “مدل جدید اپن ای آی O3-mini، پیشرفت‌های چشمگیر در آزمون‌ها و برتری در ایمنی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *