Link:snap-video
Snap影片是一個影片優先的模型,透過延伸EDM框架系統地解決影片生成域中的運動保真度、視覺質量和可擴充套件性等挑戰。該模型利用幀間的冗餘資訊,提出了一個可伸縮的transformer架構,將空間和時間維度作為一個高度壓縮的1D潛在向量,從而有效地進行空間時間聯合建模,合成時間連貫性強、運動複雜的影片。這種架構使模型可以高效訓練,達到數十億引數規模,在多項基準測試中取得最優效果。
需求人群:
"可用於各類文字到影片任務,如故事影片、商業廣告、課程演示等自動影片內容生成。"
使用場景示例:
根據廣告語‘小白兔奶糖,好吃不上火’生成相關影片。
輸入‘一隻貓正在追逐蝴蝶’生成相關短影片。
輸入’புத்தாண்டு வாழ்த்துக்கள்’生成相關的新年問候影片。
產品特色:
延伸EDM框架支援影片生成
提出transformer可伸縮架構
空間時間聯合建模
高質量和時間連貫的影片合成