DL3DV-10K:大規模實景資料集,用於深度學習三維視覺研究

Link:dl3dv-10k
DL3DV-10K是一個包含超過10000個高質量影片的大規模實景資料集,每個影片都經過人工標註場景關鍵點和複雜程度,並提供相機姿態、NeRF估計深度、點雲和3D網格等。該資料集可用於通用NeRF研究、場景一致性跟蹤、視覺語言模型等計算機視覺研究。

需求人群:

["通用NeRF模型研究","場景級一致性跟蹤","視覺語言模型研究","三維重建","虛擬現實","增強現實","自動駕駛視覺感知"]

使用場景示例:

使用DL3DV-10K資料集最佳化NeRF模型表現

基於DL3DV-10K訓練視覺語言模型

使用DL3DV-10K中的視角和場景資訊進行SLAM系統開發

產品特色:

提供超過1萬個高質量影片

人工標註場景關鍵點和環境複雜度

配套相機姿態、NeRF深度等資料

支援NeRF、視覺語言模型等前沿演演算法研究

返回頂端