مطالعه اخیر منتشر شده در ژورنال Scientific Reports نشان می دهد که چت ربات های هوش مصنوعی مدل زبان بزرگ (LLM) ممکن است در کارهای خلاقانه، مانند استفاده های جایگزین طوفان فکری برای موارد معمول – که بازتابی از تفکر واگرا است، فراتر از یک انسان معمولی عمل کنند. با این حال، افرادی که بالاترین امتیاز را در این وظایف کسب کردند، همچنان از نتایج برتر چت بات پیشی گرفتند.
تفکر واگرا نوعی فرآیند فکری است که اغلب با خلاقیت مرتبط است و بر تولید ایدهها یا راهحلهای مختلف برای یک کار خاص تأکید دارد.
این شیوه ی تفکرمعمولاً با کارکرد کاربردهای جایگزین (AUT) ارزیابی میشود، که در آن از شرکتکنندگان خواسته میشود تا در مدت زمان کوتاهی تا حد امکان استفادههای جایگزین برای یک شیء روزمره ارائه دهند. پاسخ ها برای چهار دسته مختلف نمره گذاری می شوند: تسلط، انعطاف پذیری، اصالت و بسط.
میکا کویویستو و سیمونه گراسینی پاسخ ۲۵۶ شرکتکننده انسانی را با پاسخهای سه ربات چت هوش مصنوعی (ChatGPT3، ChatGPT4 و Copy.Ai) با AUTها برای چهار شی (یک طناب، یک جعبه، یک مداد و یک شمع) مقایسه کردند. این پژوهشگران اصالت پاسخها را با رتبهبندی آنها بر اساس فاصله معنایی (میزان ارتباط نزدیک پاسخ با استفاده اصلی شیء موردنظر) و خلاقیت ارزیابی کردند
.یک روش محاسباتی برای کمی کردن فاصله معنایی در مقیاس ۰ تا ۲ مورد استفاده قرار گرفت، در حالی که ارزیابهای انسانی، که از منابع اصلی پاسخها بیاطلاع بودند، خلاقیت را از ۱ تا ۵ ارزیابی کردند. پاسخ های انسانی برای فاصله معنایی (۰.۹۵ در مقابل ۰.۹۱) و خلاقیت (۲.۹۱ در مقابل ۲.۴۷).
پاسخهای انسانی در هر دو اندازهگیری دامنه بسیار بیشتری داشتند – حداقل نمرات بسیار کمتر از پاسخهای هوش مصنوعی بود، اما حداکثر نمرات به طور کلی بالاتر بود. بهترین پاسخ انسانی از بهترین پاسخ هر چت بات در هفت دسته از هشت دسته امتیازدهی بهتر بود.
این یافتهها نشان میدهد که چت رباتهای هوش مصنوعی اکنون میتوانند ایدههای خلاقانه را حداقل به اندازه یک انسان معمولی تولید کنند. با این حال، نویسندگان خاطرنشان می کنند که آنها فقط عملکرد را در یک کار واحد مرتبط با ارزیابی خلاقیت در نظر گرفتند. نویسندگان پیشنهاد میکنند که تحقیقات آینده میتواند چگونگی ادغام هوش مصنوعی را در فرآیند خلاقانه برای بهبود عملکرد انسان بررسی کند.