شرکت تنسنت (Tencent) از مدل جدید هوش مصنوعی خود به نام Hunyuan Video رونمایی کرد که بهصورت متنباز برای تولید ویدیو از روی متنی منتشر شده است. این مدل با ۱۳ میلیارد پارامتر، بهعنوان قدرتمندترین مدل تولید ویدیوی متنباز جهان معرفی شده است.
Hunyuan Video قادر است ویدیوهای با کیفیت بالا را از پرامپتهای متنی ایجاد کند و به گفته تنسنت، عملکرد آن در مقایسه با مدلهای پیشرفته موجود در بازار مشابه یا حتی بهتر است. این مدل، بهویژه با مدلهایی مانند Runway Gen-3 و Luma 1.6 رقابت میکند و عملکرد آن در ارزیابیهای متخصصان، برتر از آنها ارزیابی شده است.
این هوش مصنوعی توانایی تولید ویدیوهای ۵ ثانیهای را دارد و هر ویدیو بهطور متوسط در مدت ۱۵ دقیقه تولید میشود. همچنین، نرخ همترازی متن این مدل ۶۸.۵ درصد بهتر از مدلهای پیشین است که نشاندهنده دقت بالای آن در تطبیق محتوای متنی با ویدیوی تولید شده است. مدل جدید تنسنت همچنین ۹۶.۴ درصد امتیاز کیفیت بصری را کسب کرده است.
Hunyuan Video بهصورت متنباز در گیتهاب منتشر شده است، اما برای استفاده از آن در سایت رسمی تنسنت، کاربران باید اعتبار خریداری کنند. هر ویدیو به ۱۵ اعتبار نیاز دارد و بستههای ۱۵۰ اعتبار به قیمت ۹.۹۹ دلار در دسترس هستند. همچنین کاربران میتوانند این مدل را بهطور رایگان در سایت FAL.ai آزمایش کنند.
این رونمایی در حالی صورت میگیرد که کمپین ۱۲ روزه OpenAI در حال برگزاری است و بهاحتمال زیاد در این مدت، شرکت OpenAI نیز مدل مشابهی بهنام Sora را بهطور عمومی منتشر خواهد کرد.
کد خبر ۲۱۲۰۳۰۹۱۸.۵۶۰