電腦視覺

JavaVision：基於Java的全能視覺智慧辨識專案

JavaVision是一個基於Java開發的全能視覺智慧辨識專案，它不僅實作了PaddleOCR-V4、YoloV8物體辨識、人臉辨識、以圖搜圖等核心功能，還可以輕鬆擴充到其他領網域，如語音辨識、動物辨識、安防檢查等。專案特點包括使用SpringBoot框架、多功能性、高效能、可靠穩定、易於整合和靈活可拓展。

MASA：用於跨領網域影片幀中對象匹配的通用模型

目標跟蹤, 電腦視覺

MASA是一個用於影片幀中對象匹配的先進模型，它能夠處理複雜場景中的多目標跟蹤（MOT）。MASA不依賴於特定領網域的標註影片資料集，而是透過Segment Anything Model（SAM）豐富的對象分割，學習實例級別的對應關係。

VastGaussian：3D場景重建的開源專案

3D場景重建, 電腦視覺

VastGaussian是一個3D場景重建的開源專案，它透過使用3D高斯來模擬大型場景的幾何和外觀資訊。這個專案是作者從零開始實作的，可能存在一些錯誤，但為3D場景重建領網域提供了一種新的嘗試。專案的主要優點包括對大型資料集的處理能力，以及對原始3DGS專案的改進，使其更易於理解和使用。