در یک نشست محرمانه در کالیفرنیا، هوش مصنوعی توانست گروهی از برجستهترین ریاضیدانان جهان را با عملکرد خیرهکنندهاش شگفتزده کند. در این گردهمایی که بهصورت خصوصی و با رعایت توافقنامههای عدم افشا برگزار شد، ۳۰ ریاضیدان از مطرحترین دانشگاههای جهان با یک چتبات پیشرفته به نام «o4-mini» روبهرو شدند؛ مدلی که توسط شرکت «OpenAI» برای انجام استدلالهای پیچیده آموزش دیده است.
در این رقابت منحصر بهفرد، ریاضیدانان تلاش کردند مسائلی طراحی کنند که خودشان بتوانند حل کنند اما برای مدل هوش مصنوعی بسیار دشوار باشد. شرکت «Epoch AI» نیز با هدف ارزیابی پیشرفت مدلهای زبانی جدید، پروژهای به نام «FrontierMath» راهاندازی کرده و صدها مسئله چالشبرانگیز طراحی کرده بود. جالب آنکه مدل «o4-mini» توانست حدود ۲۰ درصد از این مسائل دشوار را با موفقیت حل کند.
یکی از شرکتکنندگان، «کن اونو» ریاضیدان سرشناس دانشگاه ویرجینیا، اعلام کرد که این مدل در حل یک مسئله باز در نظریه اعداد، نهتنها پاسخ صحیح ارائه داد، بلکه روند تفکر و استدلال خود را نیز بهطور کامل و منطقی تشریح کرد. این عملکرد درحالی بود که پیش از آن، حتی مدلهای زبانی قدرتمند قبلی نیز قادر به حل چنین مسائلی نبودند.
در جریان این نشست، چالشی ترتیب داده شد که برای هر مسئلهای که چتبات موفق به حل آن نشود، پاداشی ۷۵۰۰ دلاری به طراح آن تعلق میگرفت. با این حال، تنها ده سؤال توانستند عملکرد این مدل را متوقف کنند.
یانگ هوی هی، ریاضیدان مؤسسه ریاضیات لندن که از پیشگامان استفاده از هوش مصنوعی در ریاضی است، در اینباره گفت: «عملکرد این مدل مانند یک دانشجوی دکترای برجسته است، اما با سرعتی خارقالعاده. کاری که برای انسانها هفتهها یا ماهها طول میکشد، توسط این مدل در چند دقیقه انجام میشود.»
اگرچه این پیشرفت شگفتانگیز است، اما نگرانیهایی نیز در میان متخصصان ایجاد کرده است. برخی معتقدند اعتماد بیشازحد به پاسخهای مدلهای زبانی ممکن است پیامدهای علمی جدی داشته باشد، بهویژه زمانی که این مدلها با اطمینان کامل استدلالهای خود را ارائه میدهند.
در پایان این نشست، بحثهایی در مورد آینده ریاضیات و نقش انسان در آن شکل گرفت. برخی شرکتکنندگان باور داشتند که در آیندهای نهچندان دور، ریاضیدانان بیشتر به طراحان پرسش تبدیل خواهند شد تا حلکنندگان آنها.
این مطالعه و رویداد در مجله معتبر Scientific American منتشر شده است.
کد خبر ۲۱۲۰۴۰۴۲۳.۵۰۹
منبع: لایو ساینس