دو پژوهش تازه که ۶ فوریه در نشریه Nature Health منتشر شدهاند نشان میدهند چتباتهای مبتنی بر مدلهای زبانی بزرگ (LLM) میتوانند در محیطهای درمانی کمامکانات، عملکردی فراتر از انتظار داشته باشند و حتی در برخی موارد از پزشکان آموزشدیده پیشی بگیرند.
بر اساس این مطالعات که در رواندا و پاکستان انجام شده، استفاده از چتباتهای ارزانقیمت هوش مصنوعی باعث افزایش چشمگیر دقت تشخیص پزشکی شده است؛ آن هم در کشورهایی که با کمبود پزشک، حجم بالای بیماران و منابع محدود مواجهاند.
در رواندا، پاسخهای ارائهشده توسط چتباتها در تمام شاخصهای ارزیابی، از جمله همخوانی با اجماع پزشکی، درک صحیح پرسش و کاهش احتمال آسیب به بیمار، امتیازی بالاتر از پزشکان محلی کسب کردند. پژوهشگران همچنین نشان دادند این مدلها قادرند به زبان «کینیارواندا»، زبان ملی رواندا، به سؤالات پزشکی پاسخ دهند.
در این مطالعه، بیش از ۱۰۰ بهورز محلی فهرستی شامل ۵۶۰۰ پرسش رایج بیماران را گردآوری کردند و پاسخهای پنج مدل زبانی با پاسخ پزشکان مقایسه شد. نتایج نشان داد همه مدلها در ۱۱ معیار ارزیابی، عملکرد بهتری داشتند. از سوی دیگر، هزینه هر پاسخ چتباتها بهطور متوسط حدود ۵۰۰ برابر کمتر از پاسخ پزشکان و پرستاران بود.
در پاکستان نیز یک کارآزمایی تصادفی نشان داد پزشکانی که از مدل GPT-4o برای کمک به تشخیص استفاده میکردند، به میانگین امتیاز استدلال تشخیصی ۷۱ درصد رسیدند؛ در حالی که این عدد برای پزشکانی که تنها به منابع سنتی مانند PubMed و جستوجوی اینترنتی متکی بودند، ۴۳ درصد بود. حتی در تحلیل ثانویه مشخص شد که عملکرد یک مدل زبانی بهتنهایی در برخی موارد از پزشکانِ مجهز به هوش مصنوعی نیز بهتر بوده است، هرچند در حدود ۳۱ درصد موارد، پزشکان توانستند بهتر از هوش مصنوعی عمل کنند؛ بهویژه در پروندههایی که نشانههای هشداردهنده و عوامل زمینهای پیچیده وجود داشت.
کارشناسان معتقدند این نتایج نشان میدهد مدلهای زبانی میتوانند بهعنوان ابزاری پشتیبان، به بهبود سطح مراقبتهای پزشکی در کشورهای با درآمد کم و متوسط کمک کنند. با این حال، پژوهشگران تأکید دارند که برای اطمینان از ایمنی و کارایی، این یافتهها باید در کشورهای دیگر و با چتباتهای متنوعتر تکرار شوند.
کد خبر ۲۰۱۰۴۱۱۲۰.۰۵۹
منبع:نیچر