Stable Code 3B:穩定程式碼3B – 用於文字生成的預訓練語言模型

Link:stable-code-3b
Stable Code 3B是一個擁有27億引數的僅解碼器語言模型,預訓練於1300億個多樣的文字和程式碼資料標記。Stable Code 3B在18種程式設計語言上進行了訓練,並在使用BigCode的評估工具進行測試時,在多種程式設計語言上展現出與同等規模模型相比的最先進效能。它支援長上下文,使用了長度達16384的序列進行訓練,並具有填充中間功能(FIM)。使用者可以透過Hugging Face網站上的程式碼片段開始使用Stable Code 3B生成文字。該模型由Stability AI開發,基於GPT-NeoX庫,可用於英文和程式設計語言。

需求人群:

"使用者可以使用穩定程式碼3B進行文字生成,也可以作為應用程式特定微調的基礎模型。"

使用場景示例:

使用Stable Code 3B生成Python程式碼示例

使用Stable Code 3B生成JavaScript程式碼示例

使用Stable Code 3B進行文字生成示例

產品特色:

填充中間功能(FIM)

支援長上下文,訓練序列長度達16384

用於文字生成

返回頂端