PixArt-Sigma：4K文字到影象生成的擴散變換器

Link：pixart-sigma
PixArt-Sigma是一個基於PyTorch的模型定義、預訓練權重和推理/取樣程式碼的集合，用於探索4K文本到影象生成的弱到強訓練擴散變換器。它支援從低解析度到高解析度的影象生成，提供了多種功能和優勢，如快速體驗、使用者友好的程式碼庫和多種模型選擇。

需求人群：

"適用於需要從文本描述生成高解析度影象的場景，如數字藝術創作、遊戲設計、廣告製作等。"

使用場景示例：

生成描述為「60年代的灰髮絡腮鬍男子，穿著羊毛外套和棕色貝雷帽，戴著眼鏡，電影感」的影象。

建立具有「法國街頭背景，逆光，邊緣光，富士膠片風格」的法國女性身體照片。

製作「兩艘海盜船在咖啡杯內航行並戰鬥的照片寫實風格近景影片」。

產品特色：

文本到影象生成

弱到強訓練

4K高解析度影象生成

多種模型選擇

快速體驗

其他相關AI產品