Carteisa Sonic:低延遲語音模型,生成逼真語音

Sonic是由Carteisa團隊開發的低延遲語音模型,旨在為各種設備提供逼真的語音生成能力。該模型利用了創新的狀態空間模型架構,以實作高解析度音訊和影片的高效、低延遲生成。Sonic模型的延遲僅為135毫秒,是同類模型中最快的。

Groqbook:使用Groq和Llama3快速生成整本書

Groqbook是一個基於Streamlit的應用程式,它利用Llama3在Groq上從一行提示快速構建書籍。它適用於非小說類書籍的創作,並能在幾秒鐘內生成每一章節。該應用程式混合使用Llama3-8b和Llama3-70b模型,利用較大的模型生成結構,較小的模型創造內容。

MusePose:虛擬人物生成的影象到影片框架

MusePose是由騰訊音樂娛樂的Lyra Lab開發的一款影象到影片的生成框架,旨在透過姿勢控制訊號生成虛擬人物的影片。它是Muse開源系列的最後一個構建塊,與MuseV和MuseTalk一起,旨在推動社群向生成具有全身運動和互動能力的虛擬人物的願景邁進。

Codestral:為程式碼生成任務設計的AI模型

Codestral是Mistral AI團隊推出的首個程式碼生成AI模型,它能夠透過共享指令和完成API端點幫助開發者編寫和與程式碼互動。它在80多種程式語言上進行了訓練,包括Python、Java、C、C++、JavaScript和Bash等,能夠完成編碼功能、編寫測試和使用中間填充機制完成部分程式碼。

返回頂端