استارتاپ چینی دیپ سیک بار دیگر خبرساز شد و با معرفی مدل آزمایشی جدید خود به نام DeepSeek-V3.2-Exp تلاش میکند آینده هوش مصنوعی را کارآمدتر و ارزانتر کند. این مدل که نسخه تکاملیافته DeepSeek-V3.1-Terminus محسوب میشود، بر اساس معماری تازهای به نام Sparse Attention (توجه پراکنده) ساخته شده که توانایی پردازش اسناد طولانی و گفتگوهای پیچیده را به شکل چشمگیری بهبود میدهد.
به گفته کارشناسان، این فناوری میتواند هزینه اجرای مدل را تا نصف کاهش دهد و در عین حال سرعت و کارایی بالاتری ارائه دهد. در نتیجه، توسعهدهندگان، پژوهشگران و شرکتهای کوچکتر نیز میتوانند از هوش مصنوعی قدرتمند با هزینهای کمتر بهره ببرند.
مدلهای Sparse Attention تنها دادههای مهم را در نظر میگیرند و از پردازش حجم زیادی از اطلاعات غیرضروری خودداری میکنند؛ رویکردی که بهرهوری را بالا میبرد، اما نگرانیهایی درباره از دست رفتن ظرافتها و ریسک حذف اطلاعات حیاتی به همراه دارد. منتقدان میگویند این مسئله میتواند بر ایمنی و دقت نتایج اثر بگذارد.
با وجود این، دیپ سیک اعلام کرده که مدل V3.2-Exp عملکردی همسطح نسخه قبلی دارد و روی تراشههای ساخت چین مانند Ascend و Cambricon نیز بدون نیاز به تنظیمات اضافی اجرا میشود. همچنین، کدها و ابزارهای لازم برای استفاده از این مدل بهصورت متنباز (Open Source) منتشر شده تا جامعه توسعهدهندگان بتوانند آن را بررسی و ارتقا دهند.
تحلیلگران معتقدند این حرکت بخشی از رقابت فزاینده چین و آمریکا در حوزه هوش مصنوعی است. دیپ سیک با تمرکز بر کارایی و کاهش هزینهها، تلاش دارد بهجای صرفاً افزایش قدرت خام محاسباتی، مسیر متفاوتی را دنبال کند و توجه جامعه جهانی را به سوی خود جلب کند.
کد خبر ۲۱۲۰۴۰۷۰۹.۲۱۲
منبع: سی ان بی سی
2 دیدگاه در “چین با مدل جدید DeepSeek V3.2 کارایی هوش مصنوعی را دو برابر کرد”
You have a real gift for explaining things.
This gave me a whole new perspective on something I thought I already understood. Great explanation and flow!