شرکت فناوری چینی علیبابا روز دوشنبه نسل جدید مدلهای هوش مصنوعی خود با نام Qwen3 را رونمایی کرد؛ خانوادهای از مدلهای پیشرفته که به گفته این شرکت، در برخی حوزهها حتی از مدلهای پیشرفته گوگل و OpenAI نیز عملکرد بهتری دارند.
Qwen3 شامل ۸ مدل مختلف است که از نظر ابعاد از ۶۰۰ میلیون پارامتر تا ۲۳۵ میلیارد پارامتر متغیرند. این مدلها با مجوز «باز» از طریق پلتفرمهایی مانند Hugging Face و GitHub برای استفاده عمومی در دسترس قرار گرفته یا به زودی خواهند گرفت.
علیبابا این مدلها را «ترکیبی» توصیف کرده، به این معنا که میتوانند بسته به نوع درخواست، بین حالت تفکر (استدلال دقیق) و حالت سریع (پاسخگویی فوری) جابجا شوند. کاربران میتوانند میزان منابع مصرفی برای “تفکر” مدل را نیز به دلخواه تنظیم کنند.
برخی مدلها از معماری “Mixture of Experts” بهره میبرند که وظایف پیچیده را میان چند مدل تخصصی تقسیم میکند و به صرفهجویی در توان محاسباتی کمک میکند.
مدلهای Qwen3 با استفاده از مجموعه داده عظیمی شامل کتابهای درسی، کدهای برنامهنویسی، پرسش و پاسخها، و دادههای تولیدشده توسط AI آموزش دیدهاند. علیبابا میگوید که این مدلها از نظر توانایی اجرای ابزارها، پیروی از دستورالعملها و استخراج داده با فرمت خاص عملکرد بسیار خوبی دارند.
مدل Qwen-3-235B-A22B در آزمونهایی مانند Codeforces و AIME توانسته از مدل o3-mini شرکت OpenAI و حتی Gemini 2.5 Pro گوگل پیشی بگیرد. با این حال، این مدل خاص هنوز برای استفاده عمومی منتشر نشده است. بزرگترین مدل قابلدسترس Qwen3-32B نیز در رقابت با مدلهای مطرح عملکرد رقابتی دارد.
در حالیکه ایالات متحده فروش تراشههای پیشرفته به چین را محدود کرده، مدلهای متنباز پیشرفتهای مانند Qwen3 میتوانند بدون نیاز به زیرساختهای آمریکایی، در داخل چین توسعه یافته و مورد استفاده قرار گیرند. کارشناسان معتقدند این موضوع توازن رقابت میان مدلهای متنباز و بسته را به چالش میکشد.
کد خبر ۲۱۲۰۴۰۲۰۹.۰۲۶
منبع:تک کرانچ