UniVG:統一多模態影片生成系統

Link:univg
UniVG是一款統一多模態影片生成系統,能夠處理多種影片生成任務,包括文字和影象模態。透過引入多條件交叉注意力和偏置高斯噪聲,實現了高自由度和低自由度影片生成。在公共學術基準MSR-VTT上實現了最低的Fr’echet影片距離(FVD),超越了當前開源方法在人類評估上的表現,並與當前閉源方法Gen2不相上下。

需求人群:

"適用於多模態影片生成場景,如影視特效製作、影片內容創作等。"

產品特色:

多條件交叉注意力

偏置高斯噪聲

影片生成任務處理

返回頂端