GRM:用於高質量高效3D重建和生成的大型高斯重建模型
GRM是一種大規模的重建模型,能夠在0.1秒內從稀疏檢視影象中恢復3D資產,並且在8秒內實現生成。它是一種前饋的基於Transformer的模型,能夠高效地融合多檢視資訊將輸入畫素轉換為畫素對齊的高斯分佈,這些高斯分佈可以反投影成為表示場景的密集3D高斯分佈集合。我們的Transformer架構和使用3D高斯分佈的方式解鎖了一種可擴充套件、高效的重建框架。大量實驗結果證明了我們的方法在重建質量和效率方面優於其他替代方案。我們還展示了GRM在生成任務(如文字到3D和影象到3D)中的潛力,透過與現有的多檢視擴散模型相結合。