文本生成 Archives - AI書籤-全球ai人工智慧產品和服務

Workers AI LLM Playground：探索不同的文字生成模型，透過草擬訊息和微調響應來提升體驗

Workers AI LLM Playground是一個線上平臺，允許使用者透過草擬訊息和微調響應來探索不同的文本生成模型。該平臺由先進的人工智慧技術驅動，旨在為開發者和研究人員提供一個實驗和學習的環境，以更好地理解和利用大型語言模型（LLM）的能力。

Llama-3 8B Instruct 262k：一款由Gradient AI團隊開發的高效能文字生成模型

文本生成

Llama-3 8B Instruct 262k是一款由Gradient AI團隊開發的文本生成模型，它擴充了LLama-3 8B的上下文長度至超過160K，展示了SOTA（State of the Art）大型語言模型在學習長文本操作時的潛力。該模型透過適當的調整RoPE theta引數，並結合NTK-aware插值和資料驅動的最佳化技術，實作了在長文本上的高效學習。

gemma-2-27b-it：輕量級、先進的文本生成模型

大型語言模型, 文本生成

Gemma是由Google開發的一系列輕量級、先進的開放模型，基於與Gemini模型相同的研究和技術構建。它們是文本到文本的解碼器僅大型語言模型，適用於多種文本生成任務，如問答、摘要和推理。Gemma模型的相對較小的尺寸使其能夠在資源有限的環境中部署，如筆記型電腦、桌面或您自己的雲基礎設施，使每個人都能接觸到最先進的AI模型，並促進創新。

Gemma-2-27b：輕量級、先進的開放文本生成模型

文本生成, 自然語言處理

Gemma-2-27b是由Google開發的一系列輕量級、先進的開放文本生成模型，基於與Gemini模型相同的研究和技術構建。這些模型專為文本生成任務設計，如問答、摘要和推理。它們相對較小的體積使得即使在資源有限的環境中，如筆記型電腦、桌面或個人雲基礎設施上也能部署，使先進的AI模型更易於訪問，並促進創新。

Index-1.9B-Pure：輕量級大語言模型，專注於文本生成

文本生成, 自然語言處理

Index-1.9B-Pure是Index系列模型中的輕量版本，專為文本生成而設計。它在2.8T的中英文語料上進行了預訓練，與同等級模型相比，在多個評測基準上表現領先。該模型特別過濾了所有指令相關資料，以驗證指令對benchmark的影響，適用於需要高質量文本生成的領網域。

MDLM：一種高效的遮蔽擴散語言模型

文本生成, 語言模型

Masked Diffusion Language Models (MDLM) 是一種新型的語言模型，它透過遮蔽和擴散機制來生成高質量的文本資料。MDLM 透過改進的訓練方法和簡化的目標函式，提高了遮蔽擴散模型的效能，使其在語言建模基準測試中達到了新的最佳狀態，並接近自迴歸模型的困惑度。

AutoCoder：程式碼生成任務的新型模型，測試準確率高

文本生成, 機器學習

AutoCoder是一個專為程式碼生成任務設計的新型模型，其在HumanEval基準資料集上的測試準確率超過了GPT-4 Turbo（2024年4月）和GPT-4o。與之前的開源模型相比，AutoCoder提供了一個新功能：它可以自動安裝所需的包，並在使用者希望執行程式碼時嘗試執行程式碼，直到確定沒有問題。

Dolphin 2.9.1 Mixtral 1x22b：基於Dolphin-2.9-Mixtral-8x22b的先進AI模型

AI模型, 文本生成

Dolphin 2.9.1 Mixtral 1x22b是由Cognitive Computations團隊精心訓練和策劃的AI模型，基於Dolphin-2.9-Mixtral-8x22b版本，擁有Apache-2.0許可。該模型具備64k上下文容量，透過16k序列長度的全權重微調，經過27小時在8個H100 GPU上的訓練完成。Dolphin 2.9.1具有多樣的指令

Mistral-7B-v0.3：Mistral AI團隊開發的大型語言模型

大型語言模型, 文本生成

Mistral-7B-v0.3是由Mistral AI團隊開發的大型語言模型(Large Language Model, LLM)，它是Mistral-7B-v0.2的升級版，具有擴充到32768的詞彙量。該模型支援文本生成，適合於需要文本生成能力的應用場景。目前，該模型沒有內容稽覈機制，團隊正在尋求社群合作，以實作更精細的內容稽覈，滿足需要內容稽覈的部署環境。