JavaVision:基於Java的全能視覺智慧辨識專案
JavaVision是一個基於Java開發的全能視覺智慧辨識專案,它不僅實作了PaddleOCR-V4、YoloV8物體辨識、人臉辨識、以圖搜圖等核心功能,還可以輕鬆擴充到其他領網域,如語音辨識、動物辨識、安防檢查等。專案特點包括使用SpringBoot框架、多功能性、高效能、可靠穩定、易於整合和靈活可拓展。
JavaVision是一個基於Java開發的全能視覺智慧辨識專案,它不僅實作了PaddleOCR-V4、YoloV8物體辨識、人臉辨識、以圖搜圖等核心功能,還可以輕鬆擴充到其他領網域,如語音辨識、動物辨識、安防檢查等。專案特點包括使用SpringBoot框架、多功能性、高效能、可靠穩定、易於整合和靈活可拓展。
MASA是一個用於影片幀中對象匹配的先進模型,它能夠處理複雜場景中的多目標跟蹤(MOT)。MASA不依賴於特定領網域的標註影片資料集,而是透過Segment Anything Model(SAM)豐富的對象分割,學習實例級別的對應關係。
VastGaussian是一個3D場景重建的開源專案,它透過使用3D高斯來模擬大型場景的幾何和外觀資訊。這個專案是作者從零開始實作的,可能存在一些錯誤,但為3D場景重建領網域提供了一種新的嘗試。專案的主要優點包括對大型資料集的處理能力,以及對原始3DGS專案的改進,使其更易於理解和使用。