YOLO-World:實時開放詞彙物體檢測

Link:yolo-world
YOLO-World是一款先進的實時開放詞彙物體檢測器,基於You Only Look Once (YOLO)系列檢測器,並透過視覺-語言建模和大規模資料集的預訓練,增強了開放詞彙檢測能力。其採用新的可重新引數化的視覺-語言路徑聚合網路(RepVL-PAN)和區域-文字對比損失,促進了視覺和語言資訊之間的互動。YOLO-World在零-shot方式下高效地檢測各種對象,具有高效率。在具有挑戰性的LVIS資料集上,YOLO-World在V100上實現了35.4 AP和52.0 FPS,在準確性和速度方面均優於許多最新方法。此外,經過微調的YOLO-World在多項下游任務上表現出色,包括物體檢測和開放詞彙例項分割。

需求人群:

"適用於物體檢測和開放詞彙例項分割"

使用場景示例:

1. 透過YOLO-World實現實時開放詞彙物體檢測。

2. YOLO-World在LVIS資料集上進行零-shot推斷。

3. 使用YOLO-World進行物體檢測和開放詞彙例項分割。

產品特色:

實時開放詞彙物體檢測

零-shot方式下高效檢測各種對象

高效率,高速度

返回頂端