هزینه واقعی آموزش DeepSeek به یک میلیارد و سیصد میلیون دلار رسید

هزینه واقعی آموزش DeepSeek به یک میلیارد و سیصد میلیون دلار رسید
فهرست مطالب

گزارش جدیدی از شرکت تحقیقاتی مستقل “SemiAnalysis” نشان می‌دهد که ادعای اولیه مبنی بر اینکه هزینه آموزش مدل DeepSeek V3 حدود ۶ میلیون دلار است، به‌طور کامل نادرست است.

این گزارش هزینه کل سرمایه‌گذاری بر روی سرورهای DeepSeek را به یک رقم حیرت‌انگیز ۱.۳ میلیارد دلار تخمین زده است.

این گزارش به‌طور خاص به برخی از هزینه‌های نادیده‌شده مانند تحقیق و توسعه و زیرساخت‌ها اشاره می‌کند که به‌طور قابل توجهی بر رقم نهایی تأثیر گذاشته است. همچنین، DeepSeek به حدود ۵۰,۰۰۰ GPU Hopper دسترسی دارد که ممکن است منجر به برخی سوء تفاهم‌ها در صنعت شده باشد.

عملکرد مدل R1 DeepSeek نشان‌دهنده توانایی‌های منطقی قابل مقایسه‌ای با مدل‌های OpenAI است، اما هنوز به‌عنوان پیشگام بی‌چون‌وچرا در تمام معیارهای عملکرد شناخته نمی‌شود.

 به علاوه، فناوری نوآورانه “Multi-Head Latent Attention” در گزارش به‌عنوان یک انقلاب در کاهش هزینه‌های استنتاج معرفی شده که کاهش ۹۳.۳ درصدی استفاده از کش‌های کلید-مقدار را به همراه دارد.

با وجود چالش‌های بیرونی و محدودیت‌های صادراتی،به نظر می رسد که DeepSeek  برای پیشرفت و دستیابی به موفقیت‌های جدید آماده باشد. صنعت حالا با اشتیاق به تماشای واکنش این شرکت به چالش‌های جدید و فرصت‌های emergent خیره شده است.

کد خبر ۲۱۲۰۳۱۱۱۳.۰۲۷

منبع:اینترستینگ اینجیرینگ

1 دیدگاه در “هزینه واقعی آموزش DeepSeek به یک میلیارد و سیصد میلیون دلار رسید

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *