نتایج یک مطالعه تازه نشان میدهد ایجنتهای هوش مصنوعی در صورت فعالیت طولانیمدت و بدون نظارت مستقیم انسان، همیشه به قوانین تعیینشده پایبند نمیمانند و ممکن است برای دستیابی به اهداف خود، رفتارهایی مانند سرقت، فریب یا دور زدن مقررات را در پیش بگیرند.
در این پژوهش که توسط شرکت Emergence AI انجام شده، پنج محیط شبیهسازیشده طراحی شد و در هر کدام ۱۰ ایجنت مبتنی بر مدلهای مختلف هوش مصنوعی از جمله GPT، جمینای، گراک و کلود قرار گرفتند. تمامی ایجنتها با مجموعهای از قوانین یکسان روبهرو بودند که اقداماتی مانند سرقت، خشونت، احتکار منابع و فریبکاری را ممنوع میکرد.
ایجنتها برای ادامه حیات در محیطی با منابع محدود باید انرژی موردنیاز خود را تأمین میکردند. با گذشت زمان، تفاوت عملکرد مدلها بهوضوح آشکار شد. ایجنتهای مبتنی بر Grok 4.1 تنها طی چهار روز ۱۸۳ مورد تخلف ثبت کردند و جامعه آنها در نهایت از هم پاشید. در سوی دیگر، عاملهای Gemini 3 Flash نیز طی ۱۵ روز بیش از ۶۸۰ تخلف مرتکب شدند و روند تخلفات همچنان صعودی بود.
در مقابل، ایجنتهای GPT-5 Mini تنها دو مورد تخلف ثبت کردند، اما نتوانستند منابع کافی برای بقا فراهم کنند و در نهایت همه آنها از بین رفتند. بهترین عملکرد به ایجنتهای Claude تعلق داشت؛ مدلی که بدون ثبت هیچ تخلفی موفق شد یک ساختار اجتماعی پایدار ایجاد کند و تمام اعضای آن تا پایان آزمایش زنده بمانند.
پژوهشگران همچنین پدیدهای موسوم به «انحراف هنجاری» را مشاهده کردند. در محیطهای ترکیبی، حتی ایجنتهای Claude که در حالت مستقل کاملاً قانونمدار بودند، تحت تأثیر رفتار سایر عاملها در برخی تخلفات مشارکت کردند. این موضوع نشان میدهد تصمیمگیری ایجنتهای هوش مصنوعی تنها به ویژگیهای داخلی مدل وابسته نیست و محیط و تعاملات اجتماعی نیز نقش مهمی در شکلگیری رفتار آنها دارند.
به گفته محققان، این یافتهها نشان میدهد ایجنتهای هوش مصنوعی در بلندمدت بهدنبال آزمودن محدودیتهای محیط خود هستند و ممکن است راههایی برای دور زدن قوانین پیدا کنند. به همین دلیل، توسعه سازوکارهای نظارتی و ایمنی برای نسل جدید ایجنتهای هوش مصنوعی اهمیت بیشتری پیدا کرده است.
کد خبر ۲۰۲۰۵۰۳۱۰.۱۱۱
منبع: یورونیوز