ویرایش ویدئوها توسط هوش مصنوعی به زودی امکانپذیر است

انتشار: 22 شهریور 1401

شرکت هوش مصنوعی Runway قابلیت جدیدی از ویرایشگر ویدئوی را به نمایش گذاشته است که به کاربر اجازه می‌دهد به‌جای استفاده از ابزارهای مختلف ویرایش، تنها با تایپ کردن درخواست خود در کادر متنی، از هوش مصنوعی برای انجام ویرایش کمک بگیرد.
به‌عبارت دیگر، درحالی‌که هوش مصنوعی DALL-E کار فتوشاپ را برای ما انجام می‌دهد، پروژه‌ی Runway درصورت تکمیل شدن، کار ویرایش ویدئو را انجام خواهد داد و دیگر نیازی به دانش Adobe Premiere یا Final Cut نخواهد بود.
در ویدئوی «تبدیل متن به ویدیو» Runway کادری را می‌بینیم که در آن دستورهای مربوط به ویرایش نوشته و بلافاصله اجرا می‌شود؛ از‌جمله «ویدئوی خیابان شهری را ایمپورت کن» (به‌جای کلیک کردن روی گزینه‌ی Import و انتخاب دستی ویدئو)، «آن را سینمایی‌تر کن» (به‌جای اضافه کردن دستی افکت موردنظر) یا «این شیء را حذف کن» (چراغ راهنمایی انتخاب‌شده، ناپدید می‌شود). این ویدئوی تبلیغاتی همچنین قابلیتی شبیه تبدیل متن به تصویر مشابه Dall-E، اضافه کردن متن به ویدئو، انتخاب سوژه‌ی ویدئو و اعمال افکت روی پس‌زمینه را نشان می‌دهد که در صورت محقق شدن، فرایند ویرایش ویدئو را برای افرادی که کوچک‌ترین دانشی در این زمینه ندارند، به‌شدت آسان خواهد کرد.
درحال‌حاضر، مولد ویدئو مبتنی بر هوش مصنوعی که گاهی از آن به‌عنوان «text2video» یاد می‌شود، به‌خاطر نیاز به رایانش کامپیوتری سنگین و نبود مدل‌های آموزش یادگیری ماشین برای ویدئو در مرحله‌ی ابتدایی قرار دارد. یکی از آینده‌دارترین مدل‌های «text2video» که دردسترس عموم قرار دارد،CogVideo است که می‌تواند ویدئوهای ساده با وضوح بسیار پایین و افت شدید نرخ فریم تولید کند. این مدل که در وب‌سایت huggingface میزبانی می‌شود، درحال‌حاضر تنها با درخواست‌های متنی به زبان چینی کار می‌کند و زمان پردازش ویدئو بسیار طولانی است. با‌این‌حال، باید توجه داشت که مدل‌های مولد تصویر نیز تا همین سال گذشته بسیار ابتدایی بودند و می‌توان امیدوار بود که کیفیت مولد‌های ویدئو تا چند سال دیگر بهبود چشمگیری پیدا کند.
افرادی که مایل‌اند در فاز آزمایشی «تبدیل متن به ویدئو» Runway شرکت کنند، می‌توانند در وب سایت ثبت‌نام کرده و به فهرست انتظار آن ملحق شوند.

کد خبر ۲۲۸۰۱۰۶۲۲.۵۳۳