大型語言模型 Archives - Page 3 of 4 - AI書籤-全球ai人工智慧產品和服務

Stable Code Instruct 3B：基於程式碼指令的大型語言模型

Stability AI宣佈推出Stable Code Instruct 3B，這是一個大型的語言模型，專門設計用於理解和執行程式碼相關的指令。該模型的目的是幫助開發者更高效地編寫、審查和最佳化程式碼，提高軟體開發的生產力。

DBRX：一個新的高效開源大型語言模型標準

DBRX是一個由Databricks的Mosaic研究團隊構建的通用大型語言模型(LLM),在標準基準測試中表現優於所有現有開源模型。它採用Mixture-of-Experts (MoE)架構,使用362億個引數,擁有出色的語言理解、程式設計、數學和邏輯推理能力。DBRX旨在推動高質量開源LLM的發展,並且便於企業根據自身資料對模型進行定製。Databricks為企業使用者提供了互動式使用DBRX、利用其長上下文能力構建檢索增強系統,並基於自身資料構建定製DBRX模型的能力。

Grok-1：開放釋出的Grok-1模型，擁有3140億引數

大型語言模型, 專家混合模型

Grok-1是由xAI從頭開始訓練的314億引數的專家混合模型（Mixture-of-Experts）。該模型未經針對特定應用（如對話）的微調，是Grok-1預訓練階段的原始基礎模型檢查點。

MediaTek Research Breeze-7B：一款開源大型語言模型，適用於中英文

大型語言模型, 開源

MediaTek Research釋出了名為MR Breeze-7B的新開源大型語言模型，擁有70億引數，擅長處理中英文。相比先前的BLOOM-3B，MR Breeze-7B吸收了20倍的知識，使其能夠精準處理傳統中文語言的文化和語言細微差別。最佳化後，MR Breeze-7B在處理速度上勝過其他模型，為使用者帶來更流暢的體驗。定價免費。

Grok-1.5：Grok-1.5帶有改進的推理能力和128,000個標記的上下文長度。

大型語言模型, 長文字理解

Grok-1.5是一種先進的大型語言模型,具有出色的長文字理解和推理能力。它可以處理高達128,000個標記的長上下文,遠超以前模型的能力。在數學和編碼等任務中,Grok-1.5表現出色,在多個公認的基準測試中獲得了極高的分數。該模型建立在強大的分散式訓練框架之上,確保高效和可靠的訓練過程。Grok-1.5旨在為使用者提供強大的語言理解和生成能力,助力各種複雜的語言任務。

Entry Point AI：定製化大型語言模型的訓練平臺

大型語言模型

Entry Point AI是一款訓練大型語言模型的平臺，可以快速高效地進行訓練、管理和評估自定義模型，無需編寫程式碼。它提供了跨平臺的訓練工具，可以比較模型效能、標註資料集、生成合成資料，並以速度和質量優於基於對話的模型。

LangTale：LLM提示管理與團隊協作

LLM, 大型語言模型

LangTale是一個旨在簡化LLM提示管理的平臺，提供協作、版本控制、測試和效能監控等功能。LangTale使團隊成員能夠輕鬆管理和最佳化LLM提示，提高工作效率。定價詳情請訪問官方網站。

Wand AI：提供企業級大型語言模型和預測人工智慧，幫助企業提升預測能力

大型語言模型, 資料管理

Wand AI是一款基於企業級大型語言模型和預測人工智慧的資料管理工具。透過使用Wand AI，您可以將資料轉化為AI，大大提高業務的預測能力。Wand AI提供自助式、無程式碼、無麻煩的操作，專為業務使用者打造。您只需專注於自己的業務需求，Wand平臺為您提供所需的AI解決方案。無論是銷售和營銷、客戶成功、人力資源、風險與合規、運營、採購等領域，Wand AI都能為您提供強大的功能和優勢。請訪問官方網站瞭解更多資訊。

KPU – Maisa：基於 AI 的知識處理平臺,執行商業任務的簡單 API

大型語言模型

KPU (Knowledge Processing Unit) 是一種專有的豐富框架,利用了大型語言模型的強大功能,並將推理和資料處理分離在一個能夠解決複雜任務的開放系統中。它由推理引擎、執行引擎和虛擬上下文視窗三個主要元件組成。推理引擎負責設計解決使用者任務的分步計劃,利用了可插拔的大型語言模型(目前廣泛測試了 GPT-4 Turbo)。執行引擎接收來自推理引擎的命令並執行,結果作為反饋傳送回推理引擎進行重新規劃。虛擬上下文視窗管理推理引擎和執行引擎之間的資料和資訊輸入輸出。這種分離推理和執行的架構使大型語言模型能專注於推理,避免了謊言、資料處理或檢索最新資訊等缺陷。KPU 旨在提升任務質量和效能,解決大資料量、多模態內容、開放性問題解決和互動性等挑戰。

VSP-LLM：結合視覺語音處理與大型語言模型的框架

大型語言模型, 視覺語音處理

VSP-LLM是一個結合視覺語音處理（Visual Speech Processing）與大型語言模型（LLMs）的框架，旨在透過LLMs的強大能力最大化上下文建模能力。VSP-LLM設計用於執行視覺語音識別和翻譯的多工，透過自監督視覺語音模型將輸入影片對映到LLM的輸入潛在空間。該框架透過提出一種新穎的去重方法和低秩介面卡（LoRA），可以高效地進行訓練。