گزارش جدیدی از شرکت تحقیقاتی مستقل “SemiAnalysis” نشان میدهد که ادعای اولیه مبنی بر اینکه هزینه آموزش مدل DeepSeek V3 حدود ۶ میلیون دلار است، بهطور کامل نادرست است.
این گزارش هزینه کل سرمایهگذاری بر روی سرورهای DeepSeek را به یک رقم حیرتانگیز ۱.۳ میلیارد دلار تخمین زده است.
این گزارش بهطور خاص به برخی از هزینههای نادیدهشده مانند تحقیق و توسعه و زیرساختها اشاره میکند که بهطور قابل توجهی بر رقم نهایی تأثیر گذاشته است. همچنین، DeepSeek به حدود ۵۰,۰۰۰ GPU Hopper دسترسی دارد که ممکن است منجر به برخی سوء تفاهمها در صنعت شده باشد.
عملکرد مدل R1 DeepSeek نشاندهنده تواناییهای منطقی قابل مقایسهای با مدلهای OpenAI است، اما هنوز بهعنوان پیشگام بیچونوچرا در تمام معیارهای عملکرد شناخته نمیشود.
به علاوه، فناوری نوآورانه “Multi-Head Latent Attention” در گزارش بهعنوان یک انقلاب در کاهش هزینههای استنتاج معرفی شده که کاهش ۹۳.۳ درصدی استفاده از کشهای کلید-مقدار را به همراه دارد.
با وجود چالشهای بیرونی و محدودیتهای صادراتی،به نظر می رسد که DeepSeek برای پیشرفت و دستیابی به موفقیتهای جدید آماده باشد. صنعت حالا با اشتیاق به تماشای واکنش این شرکت به چالشهای جدید و فرصتهای emergent خیره شده است.
کد خبر ۲۱۲۰۳۱۱۱۳.۰۲۷
منبع:اینترستینگ اینجیرینگ
1 دیدگاه در “هزینه واقعی آموزش DeepSeek به یک میلیارد و سیصد میلیون دلار رسید”
I don’t think the title of your article matches the content lol. Just kidding, mainly because I had some doubts after reading the article.