Snap Video:Snap影片:用於文字到影片合成的可擴充套件空間時間轉換器

Link:snap-video
Snap影片是一個影片優先的模型,透過延伸EDM框架系統地解決影片生成域中的運動保真度、視覺質量和可擴充套件性等挑戰。該模型利用幀間的冗餘資訊,提出了一個可伸縮的transformer架構,將空間和時間維度作為一個高度壓縮的1D潛在向量,從而有效地進行空間時間聯合建模,合成時間連貫性強、運動複雜的影片。這種架構使模型可以高效訓練,達到數十億引數規模,在多項基準測試中取得最優效果。

需求人群:

"可用於各類文字到影片任務,如故事影片、商業廣告、課程演示等自動影片內容生成。"

使用場景示例:

根據廣告語‘小白兔奶糖,好吃不上火’生成相關影片。

輸入‘一隻貓正在追逐蝴蝶’生成相關短影片。

輸入’புத்தாண்டு வாழ்த்துக்கள்’生成相關的新年問候影片。

產品特色:

延伸EDM框架支援影片生成

提出transformer可伸縮架構

空間時間聯合建模

高質量和時間連貫的影片合成

返回頂端