V-Express:生成受控於參考影象、音訊和V-Kps序列的頭像影片

連結:https://github.com/tencent-ailab/V-Express

V-Express是一個由騰訊AI實驗室開發的頭像影片生成模型,它透過一系列漸進式丟棄操作平衡不同的控制訊號,使得生成的影片能夠同時考慮姿態、輸入影象和音訊。該模型特別針對音訊訊號較弱的情況進行了最佳化,解決了在控制訊號強度不同的情況下生成頭像影片的挑戰。

需求人群:

  • V-Express適合需要生成逼真頭像影片的開發者和研究人員,尤其是那些專注於人機互動、虛擬助手、遊戲和娛樂領網網域的專業人士。它可以幫助他們建立與真實人物相似的虛擬角色,增強使用者體驗。

使用場景示例:

  • 生成與特定人物相似的虛擬資訊主播。
  • 為線上教育平臺建立虛擬教師。
  • 在遊戲開發中,為非玩家角色生成逼真的對話動畫。

產品特色:

  • 使用生成模型增強適配器進行受控生成。
  • 透過漸進式丟棄操作平衡不同控制訊號。
  • 針對音訊訊號較弱的情況進行了特別最佳化。
  • 支援生成與給定影片一致的說話影片。
  • 能夠為固定面孔生成生動的口型動作。
  • 生成伴隨輕微面部動作的口型動作。
  • 提供引數調整以適應不同輸入條件。
  • 支援英文音訊,其他語言尚未詳細測試。
返回頂端