Phenaki:根據文字提示生成逼真影片的模型

Link:https://phenaki.video

Phenaki是一個可以根據一系列文字提示生成逼真影片的模型。它透過將影片壓縮為離散令牌的小表示來學習影片表達。模型使用時間上的因果注意力來生成影片令牌,並根據預先計算的文字令牌來條件生成影片。與之前的影片生成方法相比,Phenaki可以根據一系列提示(例如時間可變的文字或故事)生成任意長的影片。它的定位是在開放領域中生成影片。該模型還具有超出現有影片資料集範圍的泛化能力。為了更好地滿足使用者需求,Phenaki還提供了互動式示例和其他應用場景。

需求人群:

  • 適用於生成各種場景的影片,可以用於創意製作、廣告、教育等領域。

產品特色:

  • 根據文字生成逼真影片
  • 支援時間可變的文字提示
  • 可以生成任意長的影片
  • 具有泛化能力
  • 提供互動式示例
返回頂端