大型語言模型 Archives - Page 2 of 4 - AI書籤-全球ai人工智慧產品和服務

Translation Agent：使用反思工作流的代理翻譯模型

Translation Agent 是一個使用反思工作流的機器翻譯演示專案。它由 Andrew Ng 以及合作者開發，主要利用大型語言模型(LLM)進行文本翻譯，並反思翻譯結果以提出改進建議。該模型的可定製性高，可以調整翻譯風格、處理習語和專有名詞，以及針對特定地區或方言進行最佳化。

Buffer of Thoughts：提升大型語言模型的推理準確性和效率

大型語言模型, 推理增強

Buffer of Thoughts (BoT) 是一種新型的思考增強推理方法，旨在提高大型語言模型（LLMs）的準確性、效率和魯棒性。透過引入一個元緩衝區來儲存從各種任務的問題解決過程中提取的高階思考范本，稱為思考范本。

Higgs-Llama-3-70B：專為角色扮演最佳化的大型語言模型

大型語言模型, 角色扮演

Higgs-Llama-3-70B是一個基於Meta-Llama-3-70B的後訓練模型，特別針對角色扮演進行了最佳化，同時在通用領網域指令執行和推理方面保持競爭力。該模型透過監督式微調，結合人工標註者和私有大型語言模型構建偏好對，進行迭代偏好最佳化以對齊模型行為。

Open LLM Leaderboard：開放的大型語言模型排行榜

大型語言模型, 效能比較

Open LLM Leaderboard是一個由Hugging Face提供的空間，旨在展示和比較各種大型語言模型的效能。它為開發者、研究人員和企業提供了一個平臺，可以檢視不同模型在特定任務上的表現，從而幫助使用者選擇最適合自己需求的模型。

Models Table：大型語言模型的詳細列表和資訊

AI, 大型語言模型

Models Table 提供了一個包含300多個大型語言模型的列表，這些模型被所有主要的AI實驗室使用，包括Amazon Olympus, OpenAI GPT-5, OpenAI GPT-6等。

AIKit：開源大型語言模型的託管、部署、構建和微調一站式解決方案

大型語言模型, 開源

AIKit 是一個開源工具，旨在簡化大型語言模型（LLMs）的託管、部署、構建和微調過程。它提供了與OpenAI API相容的REST API，支援多種推理能力和格式，使使用者可以使用任何相容的用戶端傳送請求。

EasyEdit：易用的大規模語言模型知識編輯框架

大型語言模型, 知識編輯

EasyEdit 是一個面向大型語言模型（LLMs）的易用知識編輯框架，旨在幫助使用者高效、準確地調整預訓練模型的特定行為。它提供了統一的編輯器、方法和評估框架，支援多種知識編輯技術，如ROME、MEND等。

Mistral-7B-Instruct-v0.3：大型語言模型，支援指令式對話和功能呼叫

大型語言模型, 指令式對話

Mistral-7B-Instruct-v0.3是由Mistral AI Team開發的大型語言模型，它是Mistral-7B-v0.3的指令式微調版本。該模型具有擴充的詞彙量、支援v3 Tokenizer和功能呼叫。它能夠透過指令式對話和功能呼叫來生成文本，適合於需要互動式對話和自動化任務的場景。

Mistral-7B-v0.3：Mistral AI團隊開發的大型語言模型

大型語言模型, 文本生成

Mistral-7B-v0.3是由Mistral AI團隊開發的大型語言模型(Large Language Model, LLM)，它是Mistral-7B-v0.2的升級版，具有擴充到32768的詞彙量。該模型支援文本生成，適合於需要文本生成能力的應用場景。目前，該模型沒有內容稽覈機制，團隊正在尋求社群合作，以實作更精細的內容稽覈，滿足需要內容稽覈的部署環境。

Deepmark AI :評估大型語言模型（LLM）的基準工具，對各種任務特定指標進行評估

大型語言模型

Deepmark AI 是一款用於評估大型語言模型（LLM）的基準工具，可在自己的資料上對各種任務特定指標進行評估。它與 GPT-4、Anthropic、GPT-3.5 Turbo、Cohere、AI21 等領先的生成式 AI API 進行預整合。