Sora:大規模影片生成擴散模型
Sora是一個基於大規模訓練的文字控制影片生成擴散模型。它能夠生成長達1分鐘的高畫質影片,涵蓋廣泛的視覺資料型別和解析度。Sora透過在影片和影象的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴充套件的影片生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和互動,揭示了繼續擴大影片生成模型規模來發展高能力模擬器的前景。
Sora是一個基於大規模訓練的文字控制影片生成擴散模型。它能夠生成長達1分鐘的高畫質影片,涵蓋廣泛的視覺資料型別和解析度。Sora透過在影片和影象的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴充套件的影片生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和互動,揭示了繼續擴大影片生成模型規模來發展高能力模擬器的前景。