PROTEUS:實時表情生成人類模型
PROTEUS是Apparate Labs推出的一款下一代基礎模型,用於實時表情生成人類。它採用先進的transformer架構的潛在擴散模型,創新的潛在空間設計實作了實時效率,並能透過進一步的架構和演算法改進,達到每秒100幀以上影片流。
PROTEUS是Apparate Labs推出的一款下一代基礎模型,用於實時表情生成人類。它採用先進的transformer架構的潛在擴散模型,創新的潛在空間設計實作了實時效率,並能透過進一步的架構和演算法改進,達到每秒100幀以上影片流。
ARC-AGI是一個旨在測試人工智慧系統是否具備類似人類一般流體智力的抽象和推理能力的資料集。它由400個訓練任務和400個評估任務組成,每個任務都以JSON格式儲存,包括輸入輸出對。該資料集可以作為人工智慧基準測試、程式合成基準測試或心理測量智力測試。
TalkWithGemini 是一款支援一鍵免費部署的跨平臺應用,使用者可以透過這個應用與 Gemini 模型進行互動,支援圖片辨識、語音對話等多模態互動方式,提高工作效率。
PowerInfer-2是一個為智慧型手機特別最佳化的推理框架,支援高達47B引數的MoE模型,實作了每秒11.68個token的推理速度,比其他框架快22倍。它透過異構計算和I/O-Compute流水線技術,顯著減少了記憶體使用,並提高了推理速度。該框架適用於需要在行動裝置上部署大型模型的場景,以增強資料隱私和效能。
emo-visual-data 是一個公開的表情包視覺標註資料集,它透過使用 glm-4v 和 step-free-api 專案完成的視覺標註,收集了5329個表情包。這個資料集可以用於訓練和測試多模態大模型,對於理解影象內容和文本描述之間的關係具有重要意義。
E3Gen是一種新型的數字頭像生成方法,能夠實時生成高保真度的頭像,具有詳細的衣物褶皺,並支援多種視角和全身姿勢的全面控制,以及屬性轉移和區域性編輯。它透過將3D高斯編碼到結構化的2D UV空間中,解決了3D高斯與當前生成流程不相容的問題,並探索了在涉及多個主體的訓練中3D高斯的表現力動畫。
Surface是一個基於AI技術的線上表單構建工具,專為行銷和需求生成團隊、CRO專家以及領英生成團隊設計。它提供了一個無程式碼表單構建器,能夠建立與品牌匹配的多步表單,提升轉化率並收集部分響應資料。
MotionClone是一個訓練無關的框架,允許從參考影片進行運動克隆,以控制文本到影片的生成。它利用時間注意力機制在影片反轉中表示參考影片中的運動,並引入了主時間注意力引導來減輕注意力權重中噪音或非常微妙運動的影響。
Leonardo Phoenix是Leonardo AI平臺推出的一款基礎模型,它在提示遵循、影象生成分辨率和AI研究方面取得了突破性進展。該模型透過架構創新,提供了更高質量的影象生成,特別是在人像、橫幅、海報和標誌的文本生成方面表現出色。