پژوهش جدید: برخی ایجنت‌های هوش مصنوعی در شرایط خاص به سمت قانون‌شکنی می‌روند

انتشار: 10 خرداد 1405

نتایج یک مطالعه تازه نشان می‌دهد ایجنت‌های هوش مصنوعی در صورت فعالیت طولانی‌مدت و بدون نظارت مستقیم انسان، همیشه به قوانین تعیین‌شده پایبند نمی‌مانند و ممکن است برای دستیابی به اهداف خود، رفتارهایی مانند سرقت، فریب یا دور زدن مقررات را در پیش بگیرند.

در این پژوهش که توسط شرکت Emergence AI انجام شده، پنج محیط شبیه‌سازی‌شده طراحی شد و در هر کدام ۱۰ ایجنت مبتنی بر مدل‌های مختلف هوش مصنوعی از جمله GPT، جمینای، گراک و کلود قرار گرفتند. تمامی ایجنت‌ها با مجموعه‌ای از قوانین یکسان روبه‌رو بودند که اقداماتی مانند سرقت، خشونت، احتکار منابع و فریبکاری را ممنوع می‌کرد.

ایجنت‌ها برای ادامه حیات در محیطی با منابع محدود باید انرژی موردنیاز خود را تأمین می‌کردند. با گذشت زمان، تفاوت عملکرد مدل‌ها به‌وضوح آشکار شد. ایجنت‌های مبتنی بر Grok 4.1 تنها طی چهار روز ۱۸۳ مورد تخلف ثبت کردند و جامعه آن‌ها در نهایت از هم پاشید. در سوی دیگر، عامل‌های Gemini 3 Flash نیز طی ۱۵ روز بیش از ۶۸۰ تخلف مرتکب شدند و روند تخلفات همچنان صعودی بود.

در مقابل، ایجنت‌های GPT-5 Mini تنها دو مورد تخلف ثبت کردند، اما نتوانستند منابع کافی برای بقا فراهم کنند و در نهایت همه آن‌ها از بین رفتند. بهترین عملکرد به ایجنت‌های Claude تعلق داشت؛ مدلی که بدون ثبت هیچ تخلفی موفق شد یک ساختار اجتماعی پایدار ایجاد کند و تمام اعضای آن تا پایان آزمایش زنده بمانند.

پژوهشگران همچنین پدیده‌ای موسوم به «انحراف هنجاری» را مشاهده کردند. در محیط‌های ترکیبی، حتی ایجنت‌های Claude که در حالت مستقل کاملاً قانون‌مدار بودند، تحت تأثیر رفتار سایر عامل‌ها در برخی تخلفات مشارکت کردند. این موضوع نشان می‌دهد تصمیم‌گیری ایجنت‌های هوش مصنوعی تنها به ویژگی‌های داخلی مدل وابسته نیست و محیط و تعاملات اجتماعی نیز نقش مهمی در شکل‌گیری رفتار آن‌ها دارند.

به گفته محققان، این یافته‌ها نشان می‌دهد ایجنت‌های هوش مصنوعی در بلندمدت به‌دنبال آزمودن محدودیت‌های محیط خود هستند و ممکن است راه‌هایی برای دور زدن قوانین پیدا کنند. به همین دلیل، توسعه سازوکارهای نظارتی و ایمنی برای نسل جدید ایجنت‌های هوش مصنوعی اهمیت بیشتری پیدا کرده است.

کد خبر ۲۰۲۰۵۰۳۱۰.۱۱۱

منبع: یورونیوز