هوش مصنوعی Hunyuan Video تنسنت برای تولید ویدیو به‌صورت متن‌باز منتشر شد

انتشار: 18 آذر 1403

شرکت تنسنت (Tencent) از مدل جدید هوش مصنوعی خود به نام Hunyuan Video رونمایی کرد که به‌صورت متن‌باز برای تولید ویدیو از روی متنی منتشر شده است. این مدل با ۱۳ میلیارد پارامتر، به‌عنوان قدرتمندترین مدل تولید ویدیوی متن‌باز جهان معرفی شده است.

Hunyuan Video قادر است ویدیوهای با کیفیت بالا را از پرامپت‌های متنی ایجاد کند و به گفته تنسنت، عملکرد آن در مقایسه با مدل‌های پیشرفته موجود در بازار مشابه یا حتی بهتر است. این مدل، به‌ویژه با مدل‌هایی مانند Runway Gen-3 و Luma 1.6 رقابت می‌کند و عملکرد آن در ارزیابی‌های متخصصان، برتر از آن‌ها ارزیابی شده است.

این هوش مصنوعی توانایی تولید ویدیوهای ۵ ثانیه‌ای را دارد و هر ویدیو به‌طور متوسط در مدت ۱۵ دقیقه تولید می‌شود. همچنین، نرخ هم‌ترازی متن این مدل ۶۸.۵ درصد بهتر از مدل‌های پیشین است که نشان‌دهنده دقت بالای آن در تطبیق محتوای متنی با ویدیوی تولید شده است. مدل جدید تنسنت همچنین ۹۶.۴ درصد امتیاز کیفیت بصری را کسب کرده است.

Hunyuan Video به‌صورت متن‌باز در گیت‌هاب منتشر شده است، اما برای استفاده از آن در سایت رسمی تنسنت، کاربران باید اعتبار خریداری کنند. هر ویدیو به ۱۵ اعتبار نیاز دارد و بسته‌های ۱۵۰ اعتبار به قیمت ۹.۹۹ دلار در دسترس هستند. همچنین کاربران می‌توانند این مدل را به‌طور رایگان در سایت FAL.ai آزمایش کنند.

این رونمایی در حالی صورت می‌گیرد که کمپین ۱۲ روزه OpenAI در حال برگزاری است و به‌احتمال زیاد در این مدت، شرکت OpenAI نیز مدل مشابهی به‌نام Sora را به‌طور عمومی منتشر خواهد کرد.

کد خبر ۲۱۲۰۳۰۹۱۸.۵۶۰

1 دیدگاه در “هوش مصنوعی Hunyuan Video تنسنت برای تولید ویدیو به‌صورت متن‌باز منتشر شد”

riferimento binance گفت:

۲۱ شهریور ۱۴۰۴ در ۷:۳۶ ق٫ظ

The point of view of your article has taught me a lot, and I already know how to improve the paper on gate.oi, thank you.

پاسخ