VASA-1:實時生成逼真語音驅動人臉

VASA-1是由微軟研究院開發的一個模型,專注於實時生成與音訊相匹配的逼真人臉動畫。該技術透過深度學習演算法,能夠根據輸入的語音內容,自動生成相應的口型和麵部表情,為使用者提供一種全新的互動體驗。

Atlas:下一代電動Atlas機器人

Atlas是波士頓動力公司開發的一款先進的人形機器人,它結合了數十年的研究和實際經驗,旨在解決當今工業領網域中最艱鉅的挑戰。新一代的Atlas機器人是全電動的,比以往的液壓版本更強大,動作範圍更廣,能夠更高效地完成各種任務。

MagicClothing:基於LDM的服裝驅動影象合成AI

MagicClothing是一種基於潛在擴散模型(LDM)的新型網路架構,專門用於服裝驅動的影象合成任務。它能夠根據文本提示生成穿著特定服裝的定製化角色影象,同時確保服裝細節的保留和對文本提示的忠實呈現。

PixArt-Sigma:4K文字到影象生成的擴散變換器

PixArt-Sigma是一個基於PyTorch的模型定義、預訓練權重和推理/取樣程式碼的集合,用於探索4K文本到影象生成的弱到強訓練擴散變換器。它支援從低解析度到高解析度的影象生成,提供了多種功能和優勢,如快速體驗、使用者友好的程式碼庫和多種模型選擇。

Ai-to-pptx:使用AI技術來自動生成PPTX 支援線上修改

Ai-to-pptx 是一個使用 AI 技術 (ChatGpt 和 Gemini) 製作 PPTX 的助手,支援線上修改和匯出 PPTX。主要功能包括使用 ChatGPT 等大語言模型生成大綱、允許使用者再次修改內容、選擇不同范本、線上修改 PPTX 的文字、樣式、圖片等,支援匯出 PPTX、PDF、PNG 等多種格式。價格為付費,商業授權價格為 22000 元人民幣或 3000 美元。

返回頂端