SMPLer-X:基於大資料和大模型的人體姿態和形狀估計模型

SMPLer-X是一種基於大資料和大模型的人體姿態和形狀估計模型,能夠統一捕捉身體、手和麵部的運動,並具有廣泛的應用。該模型透過對32個不同場景的資料集進行系統研究,最佳化訓練方案並選擇資料集,從而實現了對EHPS能力的顯著提升。SMPLer-X採用Vision Transformer進行模型擴充套件,並透過微調策略將其轉化為專家模型,從而進一步提高效能。該模型在多個基準測試中均表現出色,如AGORA(107.2 mm NMVE)、UBody(57.4 mm PVE)、EgoBody(63.6 mm PVE)和EHF(62.3 mm PVE without finetuning)。SMPLer-X的優勢在於能夠處理多樣化的資料源,具有出色的泛化能力和可遷移性。