大型語言模型

DBRX:一個新的高效開源大型語言模型標準

DBRX是一個由Databricks的Mosaic研究團隊構建的通用大型語言模型(LLM),在標準基準測試中表現優於所有現有開源模型。它採用Mixture-of-Experts (MoE)架構,使用362億個引數,擁有出色的語言理解、程式設計、數學和邏輯推理能力。DBRX旨在推動高質量開源LLM的發展,並且便於企業根據自身資料對模型進行定製。Databricks為企業使用者提供了互動式使用DBRX、利用其長上下文能力構建檢索增強系統,並基於自身資料構建定製DBRX模型的能力。

Grok-1.5:Grok-1.5帶有改進的推理能力和128,000個標記的上下文長度。

Grok-1.5是一種先進的大型語言模型,具有出色的長文字理解和推理能力。它可以處理高達128,000個標記的長上下文,遠超以前模型的能力。在數學和編碼等任務中,Grok-1.5表現出色,在多個公認的基準測試中獲得了極高的分數。該模型建立在強大的分散式訓練框架之上,確保高效和可靠的訓練過程。Grok-1.5旨在為使用者提供強大的語言理解和生成能力,助力各種複雜的語言任務。

Entry Point AI:定製化大型語言模型的訓練平臺

Entry Point AI是一款訓練大型語言模型的平臺,可以快速高效地進行訓練、管理和評估自定義模型,無需編寫程式碼。它提供了跨平臺的訓練工具,可以比較模型效能、標註資料集、生成合成資料,並以速度和質量優於基於對話的模型。

Wand AI:提供企業級大型語言模型和預測人工智慧,幫助企業提升預測能力

Wand AI是一款基於企業級大型語言模型和預測人工智慧的資料管理工具。透過使用Wand AI,您可以將資料轉化為AI,大大提高業務的預測能力。Wand AI提供自助式、無程式碼、無麻煩的操作,專為業務使用者打造。您只需專注於自己的業務需求,Wand平臺為您提供所需的AI解決方案。無論是銷售和營銷、客戶成功、人力資源、風險與合規、運營、採購等領域,Wand AI都能為您提供強大的功能和優勢。請訪問官方網站瞭解更多資訊。

KPU – Maisa:基於 AI 的知識處理平臺,執行商業任務的簡單 API

KPU (Knowledge Processing Unit) 是一種專有的豐富框架,利用了大型語言模型的強大功能,並將推理和資料處理分離在一個能夠解決複雜任務的開放系統中。它由推理引擎、執行引擎和虛擬上下文視窗三個主要元件組成。推理引擎負責設計解決使用者任務的分步計劃,利用了可插拔的大型語言模型(目前廣泛測試了 GPT-4 Turbo)。執行引擎接收來自推理引擎的命令並執行,結果作為反饋傳送回推理引擎進行重新規劃。虛擬上下文視窗管理推理引擎和執行引擎之間的資料和資訊輸入輸出。這種分離推理和執行的架構使大型語言模型能專注於推理,避免了謊言、資料處理或檢索最新資訊等缺陷。KPU 旨在提升任務質量和效能,解決大資料量、多模態內容、開放性問題解決和互動性等挑戰。

VSP-LLM:結合視覺語音處理與大型語言模型的框架

VSP-LLM是一個結合視覺語音處理(Visual Speech Processing)與大型語言模型(LLMs)的框架,旨在透過LLMs的強大能力最大化上下文建模能力。VSP-LLM設計用於執行視覺語音識別和翻譯的多工,透過自監督視覺語音模型將輸入影片對映到LLM的輸入潛在空間。該框架透過提出一種新穎的去重方法和低秩介面卡(LoRA),可以高效地進行訓練。

返回頂端