مدل جدید OpenAI به نام o3 پیشرفتهای چشمگیری در زمینه مقیاسسازی مدلهای هوش مصنوعی نشان میدهد، اما هزینههای مربوط به آن نیز به طور قابل توجهی افزایش یافته است. ماه گذشته، بنیانگذاران و سرمایهگذاران حوزه هوش مصنوعی اعلام کردند که اکنون وارد «دوره دوم قوانین مقیاسسازی» شدهایم، جایی که روشهای سنتی بهبود مدلهای هوش مصنوعی، بازده کمتری دارند. آنها به یک روش جدید به نام «مقیاسسازی در زمان آزمایش» اشاره کردند که به نظر میرسد عامل اصلی عملکرد مدل o3 باشد، اما این روش چالشهای خاص خود را نیز دارد.
مدل o3 OpenAI در بنچمارکها عملکرد بسیار خوبی نشان داده است و در آزمون ARC-AGI که توانایی عمومی هوش مصنوعی را ارزیابی میکند، امتیاز بالایی کسب کرده است. همچنین در یک آزمون ریاضی دشوار که هیچ مدل دیگری بیش از ۲ درصد امتیاز نداشت، مدل o3 توانست ۲۵ درصد امتیاز بگیرد.
این پیشرفتها با احتیاط مورد بررسی قرار میگیرند، چرا که تنها تعداد کمی از افراد این مدل را آزمایش کردهاند. در عین حال، به نظر میرسد که تغییرات عمدهای در روند مقیاسسازی مدلهای هوش مصنوعی در حال رخ دادن است. نوآم براون، یکی از سازندگان مدلهای o3، در توییتی اعلام کرده است که تنها سه ماه پس از معرفی مدل o1، اکنون مدل o3 با پیشرفتهای چشمگیر معرفی شده است.
با این حال، یکی از مسائل کلیدی مدل o3 این است که برای دستیابی به این عملکرد بالا، به مقدار زیادی محاسبات نیاز است که هزینههای آن را به شدت افزایش میدهد. این مقیاسسازی در زمان آزمایش به این معنی است که OpenAI از منابع بیشتری در فاز استنتاج استفاده میکند، به این صورت که زمان بیشتری را صرف پردازش میکند یا از چیپهای محاسباتی قدرتمندتری استفاده میکند. نتیجه این کار این است که هر پاسخ هوش مصنوعی هزینه بیشتری دارد.
این افزایش هزینهها به معنی این است که o3 برای بسیاری از کاربران به گزینهای گران تبدیل خواهد شد. به عنوان مثال، در بنچمارک ARC-AGI، نسخه با امتیاز بالای o3 برای هر وظیفه بیش از ۱,۰۰۰ دلار هزینه محاسباتی داشت. به گفته فرانسوا شولت، خالق این بنچمارک، o3 حدود ۱۷۰ برابر بیشتر از نسخههای بهینهشده قبلی از منابع استفاده کرده است.
علیرغم این هزینههای بالا، شولت این مدل را یک پیشرفت بزرگ در زمینه هوش مصنوعی میداند و به آن به عنوان سیستمی که میتواند به وظایفی که هرگز با آنها مواجه نشده، پاسخ دهد، اشاره کرده است. اما او هشدار میدهد که چنین پیشرفتی هنوز اقتصادی نیست و برای حل وظایف مشابه میتوان هزینه بسیار کمتری نسبت به استفاده از هوش مصنوعی صرف کرد.
در حالی که o3 به عنوان یک پیشرفت بزرگ در مقیاسسازی هوش مصنوعی شناخته میشود، این مدل هنوز مشکلاتی دارد. مدلهای بزرگ زبان همچنان با مشکل «توهم» مواجه هستند، که در آن اطلاعات نادرستی را تولید میکنند، مشکلی که o3 نیز نتواسته آن را حل کند.
در نهایت، توسعه مدلهای o3 و مشابه آن سوالاتی را درباره هزینهها و کاربردهای آن ایجاد میکند. به نظر میرسد که این مدلها بیشتر برای وظایف پیچیده و بزرگتری مفید باشند و نه برای انجام وظایف روزمره. شاید در آینده نزدیک، شرکتهای بزرگ و مؤسسات علمی و مالی قادر به بهرهبرداری از این فناوری باشند.
کد خبر ۲۱۲۰۳۱۰۱۲.۰۲۶