連結:https://github.com/tencent-ailab/V-Express
V-Express是一個由騰訊AI實驗室開發的頭像影片生成模型,它透過一系列漸進式丟棄操作平衡不同的控制訊號,使得生成的影片能夠同時考慮姿態、輸入影象和音訊。該模型特別針對音訊訊號較弱的情況進行了最佳化,解決了在控制訊號強度不同的情況下生成頭像影片的挑戰。
需求人群:
- V-Express適合需要生成逼真頭像影片的開發者和研究人員,尤其是那些專注於人機互動、虛擬助手、遊戲和娛樂領網網域的專業人士。它可以幫助他們建立與真實人物相似的虛擬角色,增強使用者體驗。
使用場景示例:
- 生成與特定人物相似的虛擬資訊主播。
- 為線上教育平臺建立虛擬教師。
- 在遊戲開發中,為非玩家角色生成逼真的對話動畫。
產品特色:
- 使用生成模型增強適配器進行受控生成。
- 透過漸進式丟棄操作平衡不同控制訊號。
- 針對音訊訊號較弱的情況進行了特別最佳化。
- 支援生成與給定影片一致的說話影片。
- 能夠為固定面孔生成生動的口型動作。
- 生成伴隨輕微面部動作的口型動作。
- 提供引數調整以適應不同輸入條件。
- 支援英文音訊,其他語言尚未詳細測試。