語音合成

Azure 認知服務語音:讓應用透過語音與文本的轉換實作智慧互動

Azure 認知服務語音是微軟推出的一款語音辨識與合成服務,支援超過100種語言和方言的語音轉文本和文本轉語音功能。它透過建立可處理特定術語、背景噪音和重音的自訂語音模型,提高聽錄的準確度。此外,該服務還支援實時語音轉文本、語音翻譯、文本轉語音等功能,適用於多種商業場景,如字幕生成、通話後聽錄分析、影片翻譯等。

免費線上轉換文字為語音:將文本轉換為逼真語音的線上工具

該產品是一個先進的線上文字轉語音工具,使用人工智慧技術將文本轉換為自然逼真的語音。它支援多種語言和語音風格,適用於廣告、影片旁白、有聲書製作等場景,增強了內容的可訪問性和吸引力。產品背景資訊顯示,它為數字行銷人員、內容創作者、有聲書作者和教育工作者提供了極大的便利。

IMS-Toucan:多語言可控文本到語音合成工具包

IMS-Toucan是由德國斯圖加特大學自然語言處理研究所開發的多語言且可控的文本到語音合成工具包。它使用純Python和PyTorch構建,以保持簡單、易於上手,同時儘可能強大。該工具包支援教學、訓練和使用最前沿的語音合成模型,具有高度的靈活性和可定製性,適用於教育和研究領網域。

sherpa-onnx:支援多種語音辨識和語音合成功能的開源專案

sherpa-onnx 是一個基於下一代 Kaldi 的語音辨識和語音合成專案,使用onnxruntime進行推理,支援多種語音相關功能,包括語音轉文字(ASR)、文字轉語音(TTS)、說話人辨識、說話人驗證、語言辨識、關鍵詞偵測等。它支援多種平臺和作業系統,包括嵌入式系統、Android、iOS、Raspberry Pi、RISC-V、伺服器等。

返回頂端