Link:cm3leon-by-meta
CM3leon是一款集文字到影象和影象到文字生成於一身的先進模型。它採用了適應自文字模型的訓練配方,包括大規模檢索增強預訓練階段和多工監督微調階段。CM3leon具有與自迴歸模型相似的多樣性和有效性,同時訓練成本低、推理效率高。它是一種因果遮蔽的混合模態(CM3)模型,可以根據任意影象和文字內容生成文字和影象序列。相比以往只能進行文字到影象或影象到文字生成的模型,CM3leon在多模態生成方面具有更高的功能拓展。
需求人群:
CM3leon可以廣泛應用於影象生成、編輯、影象描述生成、視覺問答等多個場景。
產品特色:
文字到影象生成
影象到文字生成
文字引導影象生成和編輯
多種文字任務執行