RB-Modulation:無需訓練的擴散模型個性化定製

RB-Modulation是谷歌釋出的一種基於隨機最優控制的新型訓練免費個性化擴散模型解決方案。它透過終端成本編碼所需屬性,實作風格和內容的精確提取與控制,無需額外訓練,即可生成與參考影象風格一致且遵循給定文本提示的影象。該技術在無需訓練的情況下,透過新穎的注意力特徵聚合(AFA)模組。

Omost:將大型語言模型的編碼能力轉換為影象生成能力

Omost是一個旨在將大型語言模型(LLM)的編碼能力轉化為影象生成(更準確地說是影象組合)能力的專案。它提供了基於Llama3和Phi3變體的預訓練LLM模型,這些模型能夠編寫程式碼以使用Omost的虛擬Canvas代理來組合影象視覺內容。Canvas可以由特定的影象生成器實作來實際生成影象。

Fixie.ai:構建自然人類交流的實時人工智慧

Fixie.ai致力於開發能夠像人類一樣自然交流的人工智慧模型。我們認為,有用的、高效的、易獲取的通用人工智慧(AGI)將需要能夠在快節奏、模糊不清的自然人類交流世界中運作的模型。我們正在解決的問題是構建Ultravox,一個開源的、最先進的語音到語音模型;構建處理WebRTC上LLMs實時通訊的最佳堆疊。

Outlines:強大的結構化文本生成工具

Outlines是一個用於生成結構化文本的開源庫,它支援多種模型整合,如OpenAI、transformers等,並提供了基於Jinja范本引擎的簡單而強大的提示原語。它透過多種方式控制語言模型的生成,使輸出更加可預測,從而提高模型效率並減少所需的示例數量。

FastGPT:基於LLM大模型的開源AI知識庫構建平臺

FastGPT是一個開源的AI知識庫構建平臺,提供資料處理、模型呼叫、RAG檢索、視覺化AI工作流編排等能力,幫助使用者輕鬆構建複雜的AI應用。它支援特定領網域AI客服的構建,自動化資料預處理,工作流編排,以及強大的API整合。

返回頂端