GPT-SoVITS:強大的零樣本語音轉換和文字到語音WebUI

Link:https://github.com/RVC-Boss/GPT-SoVITS

GPT-SoVITS-WebUI是一個強大的零樣本語音轉換和文字到語音WebUI。它具有零樣本TTS、少樣本TTS、跨語言支援和WebUI工具等功能。該產品支援英語、日語和中文,提供了整合工具,包括語音伴奏分離、自動訓練集分割、中文ASR和文字標註,幫助初學者建立訓練資料集和GPT/SoVITS模型。使用者可以透過輸入5秒的聲音樣本,即可體驗即時的文字到語音轉換,還可以透過僅使用1分鐘的訓練資料對模型進行微調,以提高語音相似度和逼真度。產品支援環境準備、Python和PyTorch版本、快速安裝、手動安裝、預訓練模型、資料集格式、待辦事項和致謝。

需求人群:

  • 使用者可以用於語音轉換、語音合成、語音處理等場景。

使用場景示例:

  • 使用者可以透過輸入5秒的聲音樣本,即可體驗即時的文字到語音轉換
  • 使用者可以透過僅使用1分鐘的訓練資料對模型進行微調,以提高語音相似度和逼真度
  • 使用者可以進行不同於訓練資料集的語言推斷,目前支援英語、日語和中文

產品特色:

  • 零樣本TTS
  • 少樣本TTS
  • 跨語言支援
  • WebUI工具
返回頂端