چت‌بات‌های هوش مصنوعی از نظر خلاقیت از سطح متوسط انسان پیشی گرفته‌اند

انتشار: 27 شهریور 1402
کد خبر: 212020627-004

مطالعه اخیر منتشر شده در ژورنال Scientific Reports نشان می دهد که چت ربات های هوش مصنوعی مدل زبان بزرگ (LLM) ممکن است در کارهای خلاقانه، مانند استفاده های جایگزین طوفان فکری برای موارد معمول – که بازتابی از تفکر واگرا است، فراتر از یک انسان معمولی عمل کنند. با این حال، افرادی که بالاترین امتیاز را در این وظایف کسب کردند، همچنان از نتایج برتر چت بات پیشی گرفتند.
تفکر واگرا نوعی فرآیند فکری است که اغلب با خلاقیت مرتبط است و بر تولید ایده‌ها یا راه‌حل‌های مختلف برای یک کار خاص تأکید دارد.
این شیوه ی تفکرمعمولاً با کارکرد کاربردهای جایگزین (AUT) ارزیابی می‌شود، که در آن از شرکت‌کنندگان خواسته می‌شود تا در مدت زمان کوتاهی تا حد امکان استفاده‌های جایگزین برای یک شیء روزمره ارائه دهند. پاسخ ها برای چهار دسته مختلف نمره گذاری می شوند: تسلط، انعطاف پذیری، اصالت و بسط.
میکا کویویستو و سیمونه گراسینی پاسخ ۲۵۶ شرکت‌کننده انسانی را با پاسخ‌های سه ربات چت هوش مصنوعی (ChatGPT3، ChatGPT4 و Copy.Ai) با AUTها برای چهار شی (یک طناب، یک جعبه، یک مداد و یک شمع) مقایسه کردند. این پژوهشگران اصالت پاسخ‌ها را با رتبه‌بندی آنها بر اساس فاصله معنایی (میزان ارتباط نزدیک پاسخ با استفاده اصلی شیء موردنظر) و خلاقیت ارزیابی کردند
.یک روش محاسباتی برای کمی کردن فاصله معنایی در مقیاس ۰ تا ۲ مورد استفاده قرار گرفت، در حالی که ارزیاب‌های انسانی، که از منابع اصلی پاسخ‌ها بی‌اطلاع بودند، خلاقیت را از ۱ تا ۵ ارزیابی کردند. پاسخ های انسانی برای فاصله معنایی (۰.۹۵ در مقابل ۰.۹۱) و خلاقیت (۲.۹۱ در مقابل ۲.۴۷).
پاسخ‌های انسانی در هر دو اندازه‌گیری دامنه بسیار بیشتری داشتند – حداقل نمرات بسیار کمتر از پاسخ‌های هوش مصنوعی بود، اما حداکثر نمرات به طور کلی بالاتر بود. بهترین پاسخ انسانی از بهترین پاسخ هر چت بات در هفت دسته از هشت دسته امتیازدهی بهتر بود.
این یافته‌ها نشان می‌دهد که چت ربات‌های هوش مصنوعی اکنون می‌توانند ایده‌های خلاقانه را حداقل به اندازه یک انسان معمولی تولید کنند. با این حال، نویسندگان خاطرنشان می کنند که آنها فقط عملکرد را در یک کار واحد مرتبط با ارزیابی خلاقیت در نظر گرفتند. نویسندگان پیشنهاد می‌کنند که تحقیقات آینده می‌تواند چگونگی ادغام هوش مصنوعی را در فرآیند خلاقانه برای بهبود عملکرد انسان بررسی کند.