3D

Make-A-Shape:一個千萬級3D形狀模型

Make-A-Shape是一個新的3D生成模型,旨在以高效的方式訓練大規模資料,能夠利用1000萬個公開可用的形狀。我們創新性地引入了小波樹表示法,透過制定子帶係數濾波方案來緊湊地編碼形狀,然後透過設計子帶係數打包方案將表示佈置在低解析度網格中,使其可生成擴散模型。此外,我們還提出了子帶自適應訓練策略,使我們的模型能夠有效地學習生成粗細小波係數。最後,我們將我們的框架擴充套件為受額外輸入條件控制,以使其能夠從各種模態生成形狀,例如單/多檢視影象、點雲和低解析度體素。在大量實驗中,我們展示了無條件生成、形狀完成和條件生成等各種應用。我們的方法不僅在提供高質量結果方面超越了現有技術水平,而且在幾秒內高效生成形狀,通常在大多數條件下僅需2秒鐘。

3DAiLY:AI智慧定製3D角色和資產

3DAiLY是一款AI智慧平臺,透過AI技術定製獨特的3D角色、道具和遊戲資產。無需設計經驗,輕鬆創作出高質量的3D模型。產品定價根據定製需求而定。

Stable Zero123:高質量3D對象生成模型

Stable Zero123是一種用於檢視條件影象生成的內部訓練模型。與之前的尖端技術Zero123-XL相比,Stable Zero123產生了顯著改進的結果。它透過三項關鍵創新實現了這一目標:1. 從Objaverse中大幅過濾的改進訓練資料集,僅保留高質量的3D對象,並且比以前的方法更加真實地渲染。2. 在訓練和推斷過程中,我們為模型提供了估計的攝像機角度。這種高程條件使其能夠做出更明智、更高質量的預測。3. 預先計算的資料集(預先計算的潛變數)和支援更高批處理量的改進資料載入器,再加上第一項創新,使得訓練效率比Zero123-XL提高了40倍。該模型現在已經在Hugging Face上釋出,以便研究人員和非商業使用者下載和進行實驗。

GRM:用於高質量高效3D重建和生成的大型高斯重建模型

GRM是一種大規模的重建模型,能夠在0.1秒內從稀疏檢視影象中恢復3D資產,並且在8秒內實現生成。它是一種前饋的基於Transformer的模型,能夠高效地融合多檢視資訊將輸入畫素轉換為畫素對齊的高斯分佈,這些高斯分佈可以反投影成為表示場景的密集3D高斯分佈集合。我們的Transformer架構和使用3D高斯分佈的方式解鎖了一種可擴充套件、高效的重建框架。大量實驗結果證明了我們的方法在重建質量和效率方面優於其他替代方案。我們還展示了GRM在生成任務(如文字到3D和影象到3D)中的潛力,透過與現有的多檢視擴散模型相結合。

返回頂端