COMOSVC:一種基於一致性模型的歌唱音高轉換技術

Link:comosvc
COMOSVC是一種基於一致性模型的歌唱音高轉換技術,它可以實現高質量的轉換效果和快速的取樣速度。該技術首先設計了一個基於彌散的教師模型,用於歌唱音高轉換任務,然後透過自我一致性屬性進行知識蒸餾,以實現一步取樣。相比當前最先進的基於彌散的歌唱音高轉換系統,COMOSVC在保持可比甚至優越的轉換效能的同時,也實現了顯著更快的推理速度。

需求人群:

["將歌手A的歌聲轉換為歌手B的風格","調整歌曲人聲部分的音高和音色","為歌手提供個性化的音高轉換效果"]

使用場景示例:

用COMOSVC 把李玉剛的歌聲轉換成張學友的風格

用COMOSVC 調整歌曲人聲部分的音高,使其更適合女聲

用COMOSVC 為流行歌手提供個性化的音高轉換效果,增強他的音樂特色

產品特色:

快速的一步取樣推理

維持高質量的轉換效果

自定義的教師模型設計

自我一致性知識蒸餾

返回頂端