VoiceCraft:零樣本語音編輯和文字轉語音技術

Link:voicecraft
VoiceCraft是一種基於令牌填充的神經編解碼器語言模型, 可實現領先的語音編輯和零樣本文字轉語音(TTS)效能。對於未見過的聲音, VoiceCraft只需幾秒鐘的語音樣本就能克隆該聲音或編輯錄音。該模型適用於有聲讀物、網路影片和播客等野外資料。

需求人群:

"應用於有聲讀物、網路影片、播客等語音內容的生成和編輯。"

使用場景示例:

使用VoiceCraft生成自然語音,製作有聲書或播客節目。

編輯現有錄音,修改內容或改變說話人聲音。

從少量語音樣本中克隆某人的聲音,生成定製化的語音內容。

產品特色:

語音編輯

零樣本文字轉語音

克隆未見聲音

編輯錄音

返回頂端