Parrot:多目標強化學習框架,文字轉影象生成

Link:parrot
Parrot 是一種多目標強化學習框架,專為文字轉影象生成而設計。它透過批次 Pareto 最優選擇的方式,自動識別在 T2I 生成的 RL 最佳化過程中不同獎勵之間的最佳權衡。此外,Parrot採用了 T2I 模型和提示擴充套件網路的聯合最佳化方法,促進了生成質量感知的文字提示,從而進一步提高了最終影象質量。為了抵消由於提示擴充套件而可能導致的原始使用者提示的潛在災難性遺忘,我們在推理時引入了原始提示中心化指導,確保生成的影象忠實於使用者輸入。大量實驗和使用者研究表明,Parrot在各種質量標準,包括美學、人類偏好、影象情感和文字-影象對齊方面,均優於幾種基線方法。

需求人群:

"Parrot可用於生成高質量、符合使用者期望的影象,適用於文學創作、設計、廣告等領域。"

使用場景示例:

{
"title": "文學創作",
"description": "使用 Parrot 生成與文學作品相關的影象,提升作品視覺化效果。"
}

{
"title": "設計",
"description": "利用 Parrot 為設計專案生成高質量的影象素材,提高設計效率。"
}

{
"title": "廣告",
"description": "在廣告製作中使用 Parrot 生成符合廣告需求的影象內容,提升廣告質量。"
}

產品特色:

多目標強化學習

文字轉影象生成

批次 Pareto 最優選擇

提示擴充套件網路

影象質量最佳化

返回頂端