PixArt-Sigma:4K文字到影象生成的擴散變換器

Link:pixart-sigma
PixArt-Sigma是一個基於PyTorch的模型定義、預訓練權重和推理/取樣程式碼的集合,用於探索4K文本到影象生成的弱到強訓練擴散變換器。它支援從低解析度到高解析度的影象生成,提供了多種功能和優勢,如快速體驗、使用者友好的程式碼庫和多種模型選擇。

需求人群:

"適用於需要從文本描述生成高解析度影象的場景,如數字藝術創作、遊戲設計、廣告製作等。"

使用場景示例:

生成描述為「60年代的灰髮絡腮鬍男子,穿著羊毛外套和棕色貝雷帽,戴著眼鏡,電影感」的影象。

建立具有「法國街頭背景,逆光,邊緣光,富士膠片風格」的法國女性身體照片。

製作「兩艘海盜船在咖啡杯內航行並戰鬥的照片寫實風格近景影片」。

產品特色:

文本到影象生成

弱到強訓練

4K高解析度影象生成

多種模型選擇

快速體驗

返回頂端