هوش مصنوعی «مطمئن نیستم» را یاد گرفت؛ کاهش اعتمادبه‌نفس کاذب و افزایش قابلیت اطمینان

انتشار: 22 اردیبهشت 1405

پژوهشگران KAIST روش آموزشی تازه‌ای ارائه کرده‌اند که می‌تواند یکی از مهم‌ترین مشکلات هوش مصنوعی، یعنی اعتمادبه‌نفس بیش‌ازحد را کاهش دهد؛ مشکلی که در حوزه‌هایی مانند رانندگی خودران و تشخیص پزشکی می‌تواند بسیار خطرناک باشد، چون مدل با اطمینان بالا پاسخ نادرست می‌دهد.

به گزارش KAIST، تیمی به سرپرستی پروفسور برجسته “سِه-بوم پایک” از دانشکده علوم مغز و شناخت، به این نتیجه رسیده‌اند که مقداردهی اولیه تصادفی، که به‌طور گسترده در یادگیری عمیق استفاده می‌شود، می‌تواند یکی از دلایل اصلی این اعتمادبه‌نفس کاذب در هوش مصنوعی باشد.

برای رفع این مشکل، این پژوهشگران روشی با نام “Warm-up” پیشنهاد کرده‌اند؛ در این روش، شبکه عصبی پیش از آموزش با داده‌های واقعی، برای مدت کوتاهی با نویز تصادفی یا داده‌های بی‌معنا آموزش می‌بیند.

نتایج نشان داده است که اعتمادبه‌نفس افراطی در هوش مصنوعی از همان مرحله مقداردهی اولیه شکل می‌گیرد و می‌تواند در روند آموزش بعدی تقویت شود. حتی زمانی که داده‌های تصادفی به یک شبکه عصبی با مقداردهی اولیه تصادفی داده می‌شد، مدل با وجود ناآموخته بودن، اعتمادبه‌نفس بالایی از خود نشان می‌داد. این ویژگی در مدل‌های مولد نیز می‌تواند به توهم‌زایی منجر شود؛ یعنی تولید اطلاعات نادرست اما ظاهراً قابل‌قبول.

پژوهشگران برای حل این مسئله به سراغ مغز انسان رفتند. در مغز، پیش از تولد نیز «فعالیت عصبی خودبه‌خودی» وجود دارد؛ یعنی شبکه‌های عصبی بدون ورودی بیرونی شکل می‌گیرند.

بر همین اساس، روش گرم‌کردن مدل پیش از آموزش اصلی طراحی شد تا شبکه عصبی ابتدا با ورودی‌های تصادفی، حالتی شبیه به «نمی‌دانم» را تجربه کند. پس از این مرحله، سطح اطمینان اولیه مدل به سطحی پایین و نزدیک به حد تصادف تنظیم شد و سوگیری اعتمادبه‌نفس کاذب به‌طور محسوسی کاهش یافت.

یکی از نتایج مهم این مطالعه، بهبود عملکرد مدل در مواجهه با “داده‌های نادیده‌دیده” بود. در مدل‌های معمولی، حتی برای داده‌هایی که در آموزش دیده نشده‌اند، پاسخ‌های اشتباه با اطمینان بالا ارائه می‌شود. اما مدل‌های آموزش‌دیده با روش Warm-up توانستند بهتر تشخیص دهند که چیزی نمی‌دانند و در نتیجه، با اطمینان کمتر پاسخ دهند.

این روش همچنین در تشخیص داده‌های خارج از توزیع نیز عملکرد قوی‌تری نشان داد؛ یعنی توانایی شناسایی داده‌هایی که با داده‌های آموزشی تفاوت دارند.

به گفته پژوهشگران، این مطالعه نشان می‌دهد که هوش مصنوعی می‌تواند فراتر از صرفاً پاسخ درست دادن برود و توانایی تشخیص میان «آنچه می‌داند» و «آنچه نمی‌داند» را پیدا کند؛ قابلیتی که به آن “فراشناخت” گفته می‌شود.

پروفسور سِه-بوم پایک در این‌باره گفت: “این پژوهش نشان می‌دهد که با به‌کارگیری اصول کلیدی رشد مغز، هوش مصنوعی می‌تواند وضعیت دانسته‌های خود را به شکلی انسانی‌تر تشخیص دهد. این موضوع مهم است، زیرا کمک می‌کند AI فقط روی درست‌گویی تمرکز نکند، بلکه بفهمد چه زمانی ممکن است ناآگاه یا دچار اشتباه باشد.”

این فناوری می‌تواند در حوزه‌هایی مانند رانندگی خودران، هوش مصنوعی پزشکی و هوش مصنوعی مولد که به قابلیت اطمینان بالا نیاز دارند، به کار گرفته شود. همچنین انتظار می‌رود در روش‌های مقداردهی اولیه تقریباً تمام مدل‌های یادگیری عمیق قابل استفاده باشد و به یکی از فناوری‌های کلیدی برای افزایش اعتمادپذیری هوش مصنوعی تبدیل شود.

این پژوهش با نویسندگی نخست “جونگ‌هوان چون”، دانشجوی کارشناسی‌ارشد دانشکده علوم مغز و شناخت KAIST، انجام شده و در ۹ آوریل ۲۰۲۶ در مجله بین‌المللی Nature Machine Intelligence به‌صورت آنلاین منتشر شده است. این مقاله همچنین به‌عنوان مقاله برجسته انتخاب شده و در بخش News & Views نیز معرفی شده است.

کد خبر ۲۱۲۰۵۰۲۲۲.۸۴۷

منبع: news.kaist