FoleyCrafter:為無聲影片生成逼真且同步的聲音

FoleyCrafter是一個基於文本的影片到音訊生成框架,能夠生成與輸入影片語義相關且時間同步的高質量音訊。該技術在影片製作領網域具有重要意義,特別是在後期製作過程中,可以大大提升效率和音訊質量。它由上海人工智慧實驗室和香港中文大學(深圳)共同研發。