Masked Diffusion Transformer (MDT):Masked Diffusion Transformer是影象合成的最新技術,為ICCV 2023的SOTA(State of the Art)

Link:masked-diffusion-transformer-mdt-
MDT透過引入掩碼潛在模型方案來顯式增強擴散機率模型(DPMs)在影象中對象部分之間關係學習的能力。MDT在訓練期間在潛在空間中操作,掩蔽某些標記,然後設計一個不對稱的擴散變換器來從未掩蔽的標記中預測掩蔽的標記,同時保持擴散生成過程。MDTv2進一步透過更有效的宏 巨集 巨集網路結構和訓練策略提高了MDT的效能。

需求人群:

"適用於需要高質量影象合成的研究者和開發者,尤其是在影象生成和深度學習領域。"

使用場景示例:

使用MDT進行高解析度影象的生成

在影象合成任務中實現快速學習

利用MDTv2提高影象合成的FID分數

產品特色:

影象合成

掩碼潛在模型方案

不對稱擴散變換器

高效宏 巨集 巨集網路結構和訓練策略

返回頂端