MusicLM:生成高保真音樂的文字到音訊模型

Link:musiclm
MusicLM是一個模型,可以根據文字描述生成高保真音樂。它可以生成24kHz的音訊,音樂風格和文字描述一致,並支援根據旋律進行條件生成。透過使用MusicCaps資料集,模型在音訊質量和與文字描述的一致性方面優於之前的系統。MusicLM可以應用於不同的場景,如生成音樂片段、根據畫作描述生成音樂等。

需求人群:

可以用於生成音樂片段、根據文字描述生成音樂等場景

產品特色:

根據文字描述生成高保真音樂

生成24kHz的音訊

支援根據旋律進行條件生成

音訊質量高,與文字描述一致

返回頂端