Emu Edit:精準影象編輯,一站式滿足多工需求

Link:emu-edit
Emu Edit是一款多工影象編輯模型,透過識別和生成任務完成精準影象編輯,並在此領域內取得了最新的技術突破。Emu Edit的架構針對多工學習進行了最佳化,並在眾多工上進行訓練,包括基於區域的編輯、自由形式的編輯以及檢測和分割等計算機視覺任務。除此之外,為了更有效地處理這多種任務,我們引入了學習到的任務嵌入概念,用於指導生成過程以正確執行編輯指令。我們的模型經過多工訓練和使用學習到的任務嵌入都能顯著提升準確執行編輯指令的能力。

Emu Edit還支援對未見任務的快速適應,透過任務倒轉實現少樣本學習。在這個過程中,我們保持模型權重不變,僅更新任務嵌入來適應新任務。我們的實驗證明,Emu Edit能夠迅速適應新任務,如超解析度、輪廓檢測等。這使得在標註樣本有限或計算預算有限的情況下,使用Emu Edit進行任務倒轉特別有優勢。

為了支援對基於指令的影象編輯模型的嚴格且有根據的評估,我們還收集並公開發布了一個新的基準資料集,其中包含七種不同的影象編輯任務:背景修改(background)、綜合影象變化(global)、風格修改(style)、對象移除(remove)、對象新增(add)、區域性修改(local)以及顏色/紋理修改(texture)。此外,為了與Emu Edit進行正確比較,我們還分享了Emu Edit在資料集上的生成結果。

Emu Edit 2023 Meta保留所有版權

需求人群:

"Emu Edit適用於各種影象編輯需求,包括但不限於區域編輯、風格修改、對象新增和移除、影象分割等。"

使用場景示例:

使用Emu Edit進行精準區域編輯,修復照片中的缺陷

透過Emu Edit改變圖片的風格,實現個性化的影象處理效果

利用Emu Edit進行圖片分割,將影象的不同元素分開處理

產品特色:

區域編輯

自由形式編輯

檢測和分割

超解析度

輪廓檢測

背景修改

風格修改

對象移除

對象新增

區域性修改

顏色/紋理修改

返回頂端