پژوهشگران دانشگاه پرینستون با طراحی آزمایشی به نام CEO-Bench، توانایی مدلهای هوش مصنوعی را در مدیریت بلندمدت یک شرکت نرمافزاری شبیهسازیشده ارزیابی کردند. در این آزمون، هر مدل باید به مدت ۵۰۰ روز مجازی نقش مدیرعامل را ایفا میکرد و درباره استخدام، سرمایهگذاری، مدیریت منابع و تصمیمهای راهبردی شرکت تصمیم میگرفت.
نتایج نشان داد عملکرد اغلب مدلهای هوش مصنوعی ناامیدکننده بوده است؛ بهطوریکه بیشتر آنها پیش از پایان شبیهسازی سرمایه اولیه خود را از دست دادند و عملاً ورشکست شدند. تنها سه مدل توانستند دوره ۵۰۰ روزه را با سرمایهای بیشتر از مقدار اولیه به پایان برسانند.
نکته جالب اینکه یک الگوریتم بسیار ساده و مبتنی بر قوانین ثابت، بدون استفاده از هوش مصنوعی، عملکردی بهتر از تقریباً تمام مدلهای پیشرفته امروزی داشت.
به گفته پژوهشگران، دلیل این موضوع آن است که مدلهای هوش مصنوعی در انجام وظایف کوتاه و مشخص، مانند رفع اشکال نرمافزار، پاسخگویی به مشتری یا اجرای یک فرایند مشخص، عملکرد بسیار خوبی دارند؛ زیرا هدف روشن است، تصمیمها کوتاهمدت هستند و بازخورد سریع دریافت میشود.
اما مدیریت یک شرکت واقعی شرایط کاملاً متفاوتی دارد. در چنین محیطی، تصمیمگیریهای بلندمدت، اولویتبندی اهداف، تخصیص منابع محدود، تحلیل اطلاعات ناقص و سازگاری با شرایط متغیر اهمیت زیادی دارد؛ حوزهای که مدلهای فعلی هوش مصنوعی همچنان با چالشهای جدی روبهرو هستند.
این پژوهش نشان میدهد با وجود پیشرفت سریع هوش مصنوعی در انجام وظایف تخصصی، فاصله قابلتوجهی تا سپردن مدیریت کامل کسبوکارها به این سیستمها وجود دارد.
کد خبر ۲۱۲۰۵۰۴۰۹.۷۳۹
منبع: دکودر