MGIE:透過自然語言指令實現智慧影象編輯的開源技術。

MGIE(多模態大語言模型引導的編輯)是一項由蘋果開源的技術,利用多模態大型語言模型(MLLMs)生成影象編輯指令,透過端到端訓練,捕捉視覺想象力並執行影象處理操作,使影象編輯更加智慧、直觀。