JASCO:音樂生成模型,結合文本和音訊條件進行控制
JASCO是一個結合了符號和基於音訊的條件的文本到音樂生成模型,它能夠根據全域文本描述和細粒度的區域性控制生成高質量的音樂樣本。JASCO基於流匹配建模範式和一種新穎的條件方法,允許音樂生成同時受到區域性(例如和絃)和全域(文本描述)的控制。
JASCO是一個結合了符號和基於音訊的條件的文本到音樂生成模型,它能夠根據全域文本描述和細粒度的區域性控制生成高質量的音樂樣本。JASCO基於流匹配建模範式和一種新穎的條件方法,允許音樂生成同時受到區域性(例如和絃)和全域(文本描述)的控制。