音訊生成

GenAU:音訊生成與自動字幕生成模型

GenAU是一個由Snap Research開發的音訊生成模型,它透過AutoCap自動字幕生成模型和GenAu音訊生成架構,顯著提升了音訊生成的質量。它在生成環境聲音和效果方面具有挑戰性,特別是在資料稀缺和字幕質量不足的情況下。GenAU模型能夠生成高質量的音訊,並且在音訊合成領網域具有很大的潛力。

返回頂端