چین با مدل جدید DeepSeek V3.2 کارایی هوش مصنوعی را دو برابر کرد

انتشار: 9 مهر 1404

استارتاپ چینی دیپ سیک بار دیگر خبرساز شد و با معرفی مدل آزمایشی جدید خود به نام DeepSeek-V3.2-Exp تلاش می‌کند آینده هوش مصنوعی را کارآمدتر و ارزان‌تر کند. این مدل که نسخه تکامل‌یافته DeepSeek-V3.1-Terminus محسوب می‌شود، بر اساس معماری تازه‌ای به نام Sparse Attention (توجه پراکنده) ساخته شده که توانایی پردازش اسناد طولانی و گفتگوهای پیچیده را به شکل چشمگیری بهبود می‌دهد.

به گفته کارشناسان، این فناوری می‌تواند هزینه اجرای مدل را تا نصف کاهش دهد و در عین حال سرعت و کارایی بالاتری ارائه دهد. در نتیجه، توسعه‌دهندگان، پژوهشگران و شرکت‌های کوچک‌تر نیز می‌توانند از هوش مصنوعی قدرتمند با هزینه‌ای کمتر بهره ببرند.

مدل‌های Sparse Attention تنها داده‌های مهم را در نظر می‌گیرند و از پردازش حجم زیادی از اطلاعات غیرضروری خودداری می‌کنند؛ رویکردی که بهره‌وری را بالا می‌برد، اما نگرانی‌هایی درباره از دست رفتن ظرافت‌ها و ریسک حذف اطلاعات حیاتی به همراه دارد. منتقدان می‌گویند این مسئله می‌تواند بر ایمنی و دقت نتایج اثر بگذارد.

با وجود این، دیپ سیک اعلام کرده که مدل V3.2-Exp عملکردی هم‌سطح نسخه قبلی دارد و روی تراشه‌های ساخت چین مانند Ascend و Cambricon نیز بدون نیاز به تنظیمات اضافی اجرا می‌شود. همچنین، کدها و ابزارهای لازم برای استفاده از این مدل به‌صورت متن‌باز (Open Source) منتشر شده تا جامعه توسعه‌دهندگان بتوانند آن را بررسی و ارتقا دهند.

تحلیلگران معتقدند این حرکت بخشی از رقابت فزاینده چین و آمریکا در حوزه هوش مصنوعی است. دیپ سیک با تمرکز بر کارایی و کاهش هزینه‌ها، تلاش دارد به‌جای صرفاً افزایش قدرت خام محاسباتی، مسیر متفاوتی را دنبال کند و توجه جامعه جهانی را به سوی خود جلب کند.

کد خبر ۲۱۲۰۴۰۷۰۹.۲۱۲

منبع: سی ان بی سی

2 دیدگاه در “چین با مدل جدید DeepSeek V3.2 کارایی هوش مصنوعی را دو برابر کرد”

jalalive گفت:

۹ مهر ۱۴۰۴ در ۱:۲۲ ب٫ظ

You have a real gift for explaining things.

پاسخ
jalalive گفت:

۹ مهر ۱۴۰۴ در ۸:۵۳ ب٫ظ

This gave me a whole new perspective on something I thought I already understood. Great explanation and flow!

پاسخ