Visual Anagrams:使用預訓練擴散模型製作視覺錯覺

Link:visual-anagrams
Visual Anagrams是一種簡單的、零樣本方法,用於生成多視角視覺錯覺。我們展示了理論和實踐證明,我們的方法支援廣泛的變換,包括旋轉、翻轉、顏色反轉、傾斜、拼圖重排和隨機排列等。我們的方法使用預訓練擴散模型來估計影象的不同視角或變換中的噪聲,並將其對齊並平均。然後使用這個平均噪聲估計來進行擴散步驟。使用Visual Anagrams,您可以製作出多種多視角視覺錯覺。

需求人群:

"Visual Anagrams可用於製作各種多視角視覺錯覺,例如旋轉、翻轉、顏色反轉、傾斜、拼圖重排和隨機排列等。"

產品特色:

生成多視角視覺錯覺

支援旋轉、翻轉、顏色反轉、傾斜、拼圖重排和隨機排列等變換

使用預訓練擴散模型估計影象的不同視角或變換中的噪聲

將估計的噪聲對齊並平均,然後使用平均噪聲估計來進行擴散步驟

返回頂端