Show-1:將畫素和潛在擴散模型結合起來,以實現高效的高質量文字到影片的生成

Link:show-1
Show-1是一種高效的文字到影片生成模型,它結合了畫素級和潛變數級的擴散模型,既能生成與文字高度相關的影片,也能以較低的計算資源要求生成高質量的影片。它首先用畫素級模型生成低解析度的初步影片,然後使用潛變數模型將其上取樣到高解析度,從而結合兩種模型的優勢。相比純潛變數模型,Show-1生成的影片文字關聯更準確;相比純畫素模型,它的運算成本也更低。

需求人群:

["文字到影片生成","條件影片生成"]

使用場景示例:

輸入’A panda besides the waterfall is holding a sign that says "Show Lab"’,生成相關影片

輸入’A girl is dancing in the room’,生成女孩跳舞的影片

輸入’A cat is playing with yarn’,生成貓玩線球的影片

產品特色:

精準的文字到影片生成

高質量的影片輸出

計算資源需求低

返回頂端