影象處理 Archives - Page 2 of 14 - AI書籤-全球ai人工智慧產品和服務

ComfyUI-Fast-Style-Transfer：快速神經風格遷移的ComfyUI節點

ComfyUI-Fast-Style-Transfer是一個基於PyTorch框架開發的快速神經風格遷移外掛，它允許使用者透過簡單的操作實作影象的風格轉換。該外掛基於fast-neural-style-pytorch專案，目前只移植了基礎的推理功能。使用者可以自訂風格，透過訓練自己的模型來實作獨特的風格遷移效果。

AuraSR：基於 GAN 的超解析度影象處理模型，提升生成影象的質量

影象處理, 超解析度

AuraSR 是基於 GAN 的 Super-Resolution 模型，透過影象條件化增強技術，提升生成影象的質量。該模型採用 GigaGAN 論文的變體實作，並使用 Torch 框架。AuraSR 的優勢在於能夠有效提高影象的解析度和質量，適用於影象處理領網域。

Florence-2-base-ft：先進的視覺基礎模型，支援多種視覺和視覺-語言任務

影象處理, 視覺-語言模型

Florence-2是由微軟開發的高階視覺基礎模型，採用基於提示的方法處理廣泛的視覺和視覺-語言任務。該模型能夠解釋簡單的文本提示，執行諸如影象描述、目標偵測和分割等任務。它利用FLD-5B資料集，包含54億個註釋，覆蓋1.26億張影象，精通多工學習。其序列到序列的架構使其在零樣本和微調設定中均表現出色，證明是一個有競爭力的視覺基礎模型。

Florence-2-large-ft：先進的視覺基礎模型，支援多種視覺和視覺-語言任務

影象處理, 自然語言處理

Florence-2-large-ft是由微軟開發的高階視覺基礎模型，使用基於提示的方法來處理廣泛的視覺和視覺-語言任務。該模型能夠透過簡單的文本提示執行諸如影象描述、目標偵測和分割等任務。它利用FLD-5B資料集，包含54億個註釋，覆蓋1.26億張影象，實作多工學習。模型的序列到序列架構使其在零樣本和微調設定中均表現出色，證明其為有競爭力的視覺基礎模型。