COMOSVC:一種基於一致性模型的歌唱音高轉換技術
COMOSVC是一種基於一致性模型的歌唱音高轉換技術,它可以實現高質量的轉換效果和快速的取樣速度。該技術首先設計了一個基於彌散的教師模型,用於歌唱音高轉換任務,然後透過自我一致性屬性進行知識蒸餾,以實現一步取樣。相比當前最先進的基於彌散的歌唱音高轉換系統,COMOSVC在保持可比甚至優越的轉換效能的同時,也實現了顯著更快的推理速度。
COMOSVC是一種基於一致性模型的歌唱音高轉換技術,它可以實現高質量的轉換效果和快速的取樣速度。該技術首先設計了一個基於彌散的教師模型,用於歌唱音高轉換任務,然後透過自我一致性屬性進行知識蒸餾,以實現一步取樣。相比當前最先進的基於彌散的歌唱音高轉換系統,COMOSVC在保持可比甚至優越的轉換效能的同時,也實現了顯著更快的推理速度。