DiffusionGPT:基於LLM的文字到影象生成系統

DiffusionGPT是一種基於大型語言模型(LLM)的文字到影象生成系統。它利用擴散模型構建了針對各種生成模型的領域特定樹,從而能夠無縫地適應各種型別的提示並整合領域專家模型。此外,DiffusionGPT引入了優勢資料庫,其中的思維樹得到了人類反饋的豐富,使模型選擇過程與人類偏好保持一致。透過廣泛的實驗和比較,我們展示了DiffusionGPT的有效性,展示了它在不同領域推動影象合成邊界的潛力。