Link:stablediffusion-xl
穩定擴散 AI 是一種開源的深度學習文字到影象生成模型,由 CompVis 團隊與 Runway ML 聯合開發,並獲得 Stability AI 的運算支援。它可以根據文字描述生成高質量圖片,也可以進行影象補全、外推以及文字指導下的影象到影象轉換。穩定擴散 AI 開源了其程式碼、預訓練模型和許可證,允許使用者在單個 GPU 上執行。這使其成為第一個可以在使用者本地裝置上執行的開源深度文字到影象模型。
需求人群:
["藝術創作","平面設計","網站視覺設計","3D 建模","教育","遊戲製作","社交媒體創作","廣告創意"]
使用場景示例:
使用者可以輸入類似’一隻黃色的狗在草地上玩耍’的文字描述,穩定擴散 AI 會生成匹配描述的圖片。
使用者可以輸入’給這張貓的圖片新增一頂皇冠’這樣的提示,穩定擴散 AI 會在原圖上為貓新增皇冠。
使用者可以使用穩定擴散 AI 對影象進行補全,例如自動填充圖片中遮擋的區域。
產品特色:
根據文字提示生成新影象
根據文字對現有影象進行重繪並新增新元素
透過補全和外推修改現有影象
支援使用 ControlNet 改變影象風格和色調而保留幾何結構
支援面部替換