GoMate:基於RAG框架的可靠輸入和可信輸出系統

GoMate是一個基於Retrieval-Augmented Generation (RAG)框架的模型,專注於提供可靠輸入和可信輸出。它透過結合檢索和生成技術,提高資訊檢索和文本生成的準確性和可靠性。GoMate適用於需要高效、準確資訊處理的領網域,如自然語言處理、知識問答等。

Tencent EMMA:多模態文本到影象生成模型

EMMA是一個基於最前沿的文本到影象擴散模型ELLA構建的新型影象生成模型,能夠接受多模態提示,透過創新的多模態特徵聯結器設計,有效整合文本和補充模態資訊。該模型透過凍結原始T2I擴散模型的所有引數,並僅調整一些額外層,揭示了預訓練的T2I擴散模型可以秘密接受多模態提示的有趣特性。

CV Screener:簡化招聘流程的CV篩選范本

CV Screener是MindPal公司提供的一款線上AI解決方案,旨在幫助現代專業人士提高工作效率。透過4步CV篩選范本,使用者可以輕鬆評估求職者,辨識頂尖人才。產品背景資訊包括MindPal公司致力於採用AI技術提升工作效率,並且產品支援結果儲存、自訂資料新增、工作流程定製等功能。

MDLM:一種高效的遮蔽擴散語言模型

Masked Diffusion Language Models (MDLM) 是一種新型的語言模型,它透過遮蔽和擴散機制來生成高質量的文本資料。MDLM 透過改進的訓練方法和簡化的目標函式,提高了遮蔽擴散模型的效能,使其在語言建模基準測試中達到了新的最佳狀態,並接近自迴歸模型的困惑度。

AutoStudio:多輪互動式影象生成技術

AutoStudio是一個基於大型語言模型的多輪互動式影象生成框架,它透過三個代理與一個基於穩定擴散的代理來生成高質量影象。該技術在多主題一致性方面取得了顯著進步,透過並行UNet結構和主題初始化生成方法,提高了影象生成的質量和一致性。

返回頂端