شرکت هوش مصنوعی Runway قابلیت جدیدی از ویرایشگر ویدئوی را به نمایش گذاشته است که به کاربر اجازه میدهد بهجای استفاده از ابزارهای مختلف ویرایش، تنها با تایپ کردن درخواست خود در کادر متنی، از هوش مصنوعی برای انجام ویرایش کمک بگیرد.
بهعبارت دیگر، درحالیکه هوش مصنوعی DALL-E کار فتوشاپ را برای ما انجام میدهد، پروژهی Runway درصورت تکمیل شدن، کار ویرایش ویدئو را انجام خواهد داد و دیگر نیازی به دانش Adobe Premiere یا Final Cut نخواهد بود.
در ویدئوی «تبدیل متن به ویدیو» Runway کادری را میبینیم که در آن دستورهای مربوط به ویرایش نوشته و بلافاصله اجرا میشود؛ ازجمله «ویدئوی خیابان شهری را ایمپورت کن» (بهجای کلیک کردن روی گزینهی Import و انتخاب دستی ویدئو)، «آن را سینماییتر کن» (بهجای اضافه کردن دستی افکت موردنظر) یا «این شیء را حذف کن» (چراغ راهنمایی انتخابشده، ناپدید میشود). این ویدئوی تبلیغاتی همچنین قابلیتی شبیه تبدیل متن به تصویر مشابه Dall-E، اضافه کردن متن به ویدئو، انتخاب سوژهی ویدئو و اعمال افکت روی پسزمینه را نشان میدهد که در صورت محقق شدن، فرایند ویرایش ویدئو را برای افرادی که کوچکترین دانشی در این زمینه ندارند، بهشدت آسان خواهد کرد.
درحالحاضر، مولد ویدئو مبتنی بر هوش مصنوعی که گاهی از آن بهعنوان «text2video» یاد میشود، بهخاطر نیاز به رایانش کامپیوتری سنگین و نبود مدلهای آموزش یادگیری ماشین برای ویدئو در مرحلهی ابتدایی قرار دارد. یکی از آیندهدارترین مدلهای «text2video» که دردسترس عموم قرار دارد،CogVideo است که میتواند ویدئوهای ساده با وضوح بسیار پایین و افت شدید نرخ فریم تولید کند. این مدل که در وبسایت huggingface میزبانی میشود، درحالحاضر تنها با درخواستهای متنی به زبان چینی کار میکند و زمان پردازش ویدئو بسیار طولانی است. بااینحال، باید توجه داشت که مدلهای مولد تصویر نیز تا همین سال گذشته بسیار ابتدایی بودند و میتوان امیدوار بود که کیفیت مولدهای ویدئو تا چند سال دیگر بهبود چشمگیری پیدا کند.
افرادی که مایلاند در فاز آزمایشی «تبدیل متن به ویدئو» Runway شرکت کنند، میتوانند در وب سایت ثبتنام کرده و به فهرست انتظار آن ملحق شوند.
بهعبارت دیگر، درحالیکه هوش مصنوعی DALL-E کار فتوشاپ را برای ما انجام میدهد، پروژهی Runway درصورت تکمیل شدن، کار ویرایش ویدئو را انجام خواهد داد و دیگر نیازی به دانش Adobe Premiere یا Final Cut نخواهد بود.
در ویدئوی «تبدیل متن به ویدیو» Runway کادری را میبینیم که در آن دستورهای مربوط به ویرایش نوشته و بلافاصله اجرا میشود؛ ازجمله «ویدئوی خیابان شهری را ایمپورت کن» (بهجای کلیک کردن روی گزینهی Import و انتخاب دستی ویدئو)، «آن را سینماییتر کن» (بهجای اضافه کردن دستی افکت موردنظر) یا «این شیء را حذف کن» (چراغ راهنمایی انتخابشده، ناپدید میشود). این ویدئوی تبلیغاتی همچنین قابلیتی شبیه تبدیل متن به تصویر مشابه Dall-E، اضافه کردن متن به ویدئو، انتخاب سوژهی ویدئو و اعمال افکت روی پسزمینه را نشان میدهد که در صورت محقق شدن، فرایند ویرایش ویدئو را برای افرادی که کوچکترین دانشی در این زمینه ندارند، بهشدت آسان خواهد کرد.
درحالحاضر، مولد ویدئو مبتنی بر هوش مصنوعی که گاهی از آن بهعنوان «text2video» یاد میشود، بهخاطر نیاز به رایانش کامپیوتری سنگین و نبود مدلهای آموزش یادگیری ماشین برای ویدئو در مرحلهی ابتدایی قرار دارد. یکی از آیندهدارترین مدلهای «text2video» که دردسترس عموم قرار دارد،CogVideo است که میتواند ویدئوهای ساده با وضوح بسیار پایین و افت شدید نرخ فریم تولید کند. این مدل که در وبسایت huggingface میزبانی میشود، درحالحاضر تنها با درخواستهای متنی به زبان چینی کار میکند و زمان پردازش ویدئو بسیار طولانی است. بااینحال، باید توجه داشت که مدلهای مولد تصویر نیز تا همین سال گذشته بسیار ابتدایی بودند و میتوان امیدوار بود که کیفیت مولدهای ویدئو تا چند سال دیگر بهبود چشمگیری پیدا کند.
افرادی که مایلاند در فاز آزمایشی «تبدیل متن به ویدئو» Runway شرکت کنند، میتوانند در وب سایت ثبتنام کرده و به فهرست انتظار آن ملحق شوند.
کد خبر ۲۲۸۰۱۰۶۲۲.۵۳۳