Sora:大規模影片生成擴散模型

Link:sora
Sora是一個基於大規模訓練的文字控制影片生成擴散模型。它能夠生成長達1分鐘的高畫質影片,涵蓋廣泛的視覺資料型別和解析度。Sora透過在影片和影象的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴充套件的影片生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和互動,揭示了繼續擴大影片生成模型規模來發展高能力模擬器的前景。

需求人群:

["生成擴散模型影片內容","提供視覺模擬能力的應用開發","建立和編輯影片內容的工具"]

使用場景示例:

在影片生成應用中使用Sora生成符合文字提示的內容

結合Sora在遊戲或模擬器中生成高保真紋理和環境

透過Sora實現影象和影片的無縫編輯和過渡

產品特色:

基於文字提示生成高質量影片

生成變化解析度、長度和縱橫比的影片

基於影象和影片繼續生成

模擬物理和數字世界的某些行為

返回頂端