Link:voicecraft
VoiceCraft是一種基於令牌填充的神經編解碼器語言模型, 可實現領先的語音編輯和零樣本文字轉語音(TTS)效能。對於未見過的聲音, VoiceCraft只需幾秒鐘的語音樣本就能克隆該聲音或編輯錄音。該模型適用於有聲讀物、網路影片和播客等野外資料。
需求人群:
"應用於有聲讀物、網路影片、播客等語音內容的生成和編輯。"
使用場景示例:
使用VoiceCraft生成自然語音,製作有聲書或播客節目。
編輯現有錄音,修改內容或改變說話人聲音。
從少量語音樣本中克隆某人的聲音,生成定製化的語音內容。
產品特色:
語音編輯
零樣本文字轉語音
克隆未見聲音
編輯錄音