مدل جدید اپن ای آی O3-mini، پیشرفت‌های چشمگیر در آزمون‌ها و برتری در ایمنی

انتشار: 13 بهمن 1403

مدل جدید OpenAI به نام O3-mini توانسته در تست‌های مختلف عملکردی بهتر از مدل‌های قبلی این شرکت مانند R1 و O1 ارائه دهد، هرچند که در برخی زمینه‌ها هنوز اختلاف کمی با آنها دارد. در آزمون AIME 2024 که توانایی مدل‌ها در درک و پاسخ به دستورات پیچیده را می‌سنجند، O3-mini در تلاش‌های منطقی بالا موفق به شکست R1 شده است.

همچنین در آزمون SWE-bench Verified که بر برنامه‌نویسی متمرکز است، با اختلاف کمی (۰.۱ امتیاز) از R1 پیشی می‌گیرد.

O3-mini در مقایسه با مدل‌های O1 عملکردی مشابه با سرعت پاسخ‌دهی بالاتر و هزینه کمتر دارد، به‌ویژه در سطح تلاش منطقی متوسط. با این حال، در برخی آزمون‌ها مانند GPQA Diamond که به سوالات پیچیده فیزیک، زیست‌شناسی و شیمی می‌پردازد، مدل O3-mini نتواسته از مدل O1 پیشی بگیرد.

نکته قابل توجه دیگر، تاکید OpenAI بر ایمنی بالای مدل O3-mini است. این مدل با استفاده از روش‌های جدید نظارتی و امنیتی، از جمله «هم‌راستایی تدبیرانه»، توانسته در آزمایش‌های سخت‌گیرانه‌تر ایمنی بهتر از مدل‌های قبلی مانند GPT-4o از خود نشان دهد.

کد خبر ۲۱۲۰۳۱۱۱۳.۰۲۶

منبع: تک کرانچ

3 دیدگاه در “مدل جدید اپن ای آی O3-mini، پیشرفت‌های چشمگیر در آزمون‌ها و برتری در ایمنی”

melhor código de indicac~ao binance گفت:

۱۸ اسفند ۱۴۰۳ در ۲:۵۳ ق٫ظ

Thanks for sharing. I read many of your blog posts, cool, your blog is very good.

پاسخ
Crea un account binance گفت:

۱۷ خرداد ۱۴۰۴ در ۸:۲۱ ب٫ظ

Thanks for sharing. I read many of your blog posts, cool, your blog is very good.

پاسخ
binance گفت:

۷ مرداد ۱۴۰۴ در ۶:۰۶ ق٫ظ

Can you be more specific about the content of your article? After reading it, I still have some doubts. Hope you can help me.

پاسخ

دیدگاهتان را بنویسید لغو پاسخ

اشتراک گذاری خبر:

برچسب‌ها:

اپن ای آی پژوهشگاه ارتباطات و فناوری اطلاعات مرکز نوآوری و توسعه هوش مصنوعی مرکز هوش مصنوعی هوش مصنوعی

هوش مصنوعی به شکار «طوفان‌های فضایی» رفت

2 تیر 1405

چت جی پی تی جدید در راه است/ بهبود استدلال و کد نویسی

2 تیر 1405

هشدار عصب‌شناسان: هوش چت‌بات‌ها را با خودآگاهی ‌اشتباه نگیرید

2 تیر 1405

هوش مصنوعی از سد محرمانه‌ترین سیستم‌های آمریکا عبور کرد

1 تیر 1405

رباتی که به پرستاران کمک می‌کند؛ «آلتر-ایگو» وارد بیمارستان‌های ایتالیا شد

1 تیر 1405

هوش مصنوعی در متقاعدسازی از انسان پیشی گرفت؛ کلاد رکورد جمع‌آوری کمک مالی را شکست

1 تیر 1405