مدل هوش مصنوعی چینی DeepSeek، که در هفتههای اخیر تبدیل به یکی از موضوعات داغ خبری شده است، در ابتدا وعده کاهش مصرف انرژی در فرآیندهای هوش مصنوعی را میداد. اما طبق دادههای جدید منتشر شده، به نظر میرسد که این مدل ممکن است نه تنها انرژی کمتری مصرف نکند، بلکه مصرف آن در برخی جنبهها حتی بیشتر از مدلهای مشابه باشد.
این موضوع به ویژه در مرحله “استدلال زنجیرهای فکر” مدل DeepSeek برجسته میشود که برای رسیدن به پاسخهای دقیقتر، نیازمند پردازشهای پیچیدهتری است.
این فرآیند استدلال، که شامل تجزیه و تحلیل منطقی مسائل به صورت گامبهگام است، به دلیل تولید پاسخهای طولانیتر و پیچیدهتر، انرژی بیشتری مصرف میکند. بررسیهای اولیه نشان میدهد که مدلهای مشابه این مدل از Meta، به رغم شباهت در تعداد پارامترها، انرژی بیشتری مصرف میکنند. اگر سایر شرکتها به تقلید از DeepSeek به این رویکرد روی آورند، مصرف انرژی در صنعت هوش مصنوعی ممکن است به شدت افزایش یابد.
در حالی که مدلهای مبتنی بر استدلال زنجیرهای ممکن است دقت بیشتری داشته باشند، نگرانیهایی وجود دارد که در صورت گسترش استفاده از این تکنیک در مدلهای مختلف، هزینههای انرژی در سطح وسیعی افزایش یابد و اثرات منفی بر محیطزیست داشته باشد.
کارشناسان هشدار میدهند که استفاده گسترده از این مدلها میتواند همانطور که پیش از این در جریان تغییر پارادایم از هوش مصنوعی استخراجی به هوش مصنوعی مولد شاهد بودیم، مصرف انرژی را به طور چشمگیری افزایش دهد.
کد خبر ۲۱۲۰۳۱۱۱۶.۲۰۰
منبع:technologyreview