T-Rex2:通用視覺-語義物體檢測,無需任務特定調優
T-Rex2是一種正規化突破的物體檢測技術,能夠識別從日常到深奧的各種物體,無需任務特定調優或大量訓練資料集。它將視覺和文字提示相結合,賦予其強大的零射能力,可廣泛應用於各種場景的物體檢測任務。T-Rex2綜合了四個元件:影象編碼器、視覺提示編碼器、文字提示編碼器和框解碼器。它遵循DETR的端到端設計原理,涵蓋多種應用場景。T-Rex2在COCO、LVIS、ODinW和Roboflow100等四個學術基準測試中取得了最優秀的表現。
T-Rex2是一種正規化突破的物體檢測技術,能夠識別從日常到深奧的各種物體,無需任務特定調優或大量訓練資料集。它將視覺和文字提示相結合,賦予其強大的零射能力,可廣泛應用於各種場景的物體檢測任務。T-Rex2綜合了四個元件:影象編碼器、視覺提示編碼器、文字提示編碼器和框解碼器。它遵循DETR的端到端設計原理,涵蓋多種應用場景。T-Rex2在COCO、LVIS、ODinW和Roboflow100等四個學術基準測試中取得了最優秀的表現。