هزینه‌های انرژی DeepSeek زیادتر از مدل های مشابه است

انتشار: 16 بهمن 1403

مدل هوش مصنوعی چینی DeepSeek، که در هفته‌های اخیر تبدیل به یکی از موضوعات داغ خبری شده است، در ابتدا وعده کاهش مصرف انرژی در فرآیندهای هوش مصنوعی را می‌داد. اما طبق داده‌های جدید منتشر شده، به نظر می‌رسد که این مدل ممکن است نه تنها انرژی کمتری مصرف نکند، بلکه مصرف آن در برخی جنبه‌ها حتی بیشتر از مدل‌های مشابه باشد.

این موضوع به ویژه در مرحله “استدلال زنجیره‌ای فکر” مدل DeepSeek برجسته می‌شود که برای رسیدن به پاسخ‌های دقیق‌تر، نیازمند پردازش‌های پیچیده‌تری است.

این فرآیند استدلال، که شامل تجزیه و تحلیل منطقی مسائل به صورت گام‌به‌گام است، به دلیل تولید پاسخ‌های طولانی‌تر و پیچیده‌تر، انرژی بیشتری مصرف می‌کند. بررسی‌های اولیه نشان می‌دهد که مدل‌های مشابه این مدل از Meta، به رغم شباهت در تعداد پارامترها، انرژی بیشتری مصرف می‌کنند. اگر سایر شرکت‌ها به تقلید از DeepSeek به این رویکرد روی آورند، مصرف انرژی در صنعت هوش مصنوعی ممکن است به شدت افزایش یابد.

در حالی که مدل‌های مبتنی بر استدلال زنجیره‌ای ممکن است دقت بیشتری داشته باشند، نگرانی‌هایی وجود دارد که در صورت گسترش استفاده از این تکنیک در مدل‌های مختلف، هزینه‌های انرژی در سطح وسیعی افزایش یابد و اثرات منفی بر محیط‌زیست داشته باشد.

کارشناسان هشدار می‌دهند که استفاده گسترده از این مدل‌ها می‌تواند همانطور که پیش از این در جریان تغییر پارادایم از هوش مصنوعی استخراجی به هوش مصنوعی مولد شاهد بودیم، مصرف انرژی را به طور چشمگیری افزایش دهد.

کد خبر ۲۱۲۰۳۱۱۱۶.۲۰۰

منبع:technologyreview