علی‌بابا مدل هوش مصنوعی Qwen3 را معرفی کرد؛ رقیبی جدی برای OpenAI و گوگل

انتشار: 9 اردیبهشت 1404

شرکت فناوری چینی علی‌بابا روز دوشنبه نسل جدید مدل‌های هوش مصنوعی خود با نام Qwen3 را رونمایی کرد؛ خانواده‌ای از مدل‌های پیشرفته که به گفته این شرکت، در برخی حوزه‌ها حتی از مدل‌های پیشرفته گوگل و OpenAI نیز عملکرد بهتری دارند.

Qwen3 شامل ۸ مدل مختلف است که از نظر ابعاد از ۶۰۰ میلیون پارامتر تا ۲۳۵ میلیارد پارامتر متغیرند. این مدل‌ها با مجوز «باز» از طریق پلتفرم‌هایی مانند Hugging Face و GitHub برای استفاده عمومی در دسترس قرار گرفته یا به زودی خواهند گرفت.

علی‌بابا این مدل‌ها را «ترکیبی» توصیف کرده، به این معنا که می‌توانند بسته به نوع درخواست، بین حالت تفکر (استدلال دقیق) و حالت سریع (پاسخ‌گویی فوری) جابجا شوند. کاربران می‌توانند میزان منابع مصرفی برای “تفکر” مدل را نیز به دلخواه تنظیم کنند.
برخی مدل‌ها از معماری “Mixture of Experts” بهره می‌برند که وظایف پیچیده را میان چند مدل تخصصی تقسیم می‌کند و به صرفه‌جویی در توان محاسباتی کمک می‌کند.

مدل‌های Qwen3 با استفاده از مجموعه داده عظیمی شامل کتاب‌های درسی، کدهای برنامه‌نویسی، پرسش و پاسخ‌ها، و داده‌های تولیدشده توسط AI آموزش دیده‌اند. علی‌بابا می‌گوید که این مدل‌ها از نظر توانایی اجرای ابزارها، پیروی از دستورالعمل‌ها و استخراج داده با فرمت خاص عملکرد بسیار خوبی دارند.

مدل Qwen-3-235B-A22B در آزمون‌هایی مانند Codeforces و AIME توانسته از مدل o3-mini شرکت OpenAI و حتی Gemini 2.5 Pro گوگل پیشی بگیرد. با این حال، این مدل خاص هنوز برای استفاده عمومی منتشر نشده است. بزرگ‌ترین مدل قابل‌دسترس Qwen3-32B نیز در رقابت با مدل‌های مطرح عملکرد رقابتی دارد.

در حالی‌که ایالات متحده فروش تراشه‌های پیشرفته به چین را محدود کرده، مدل‌های متن‌باز پیشرفته‌ای مانند Qwen3 می‌توانند بدون نیاز به زیرساخت‌های آمریکایی، در داخل چین توسعه یافته و مورد استفاده قرار گیرند. کارشناسان معتقدند این موضوع توازن رقابت میان مدل‌های متن‌باز و بسته را به چالش می‌کشد.

کد خبر ۲۱۲۰۴۰۲۰۹.۰۲۶

منبع:تک کرانچ