Jais:13B引數阿拉伯語英語同構模型

Link:jais
這是一個130億引數的預訓練雙語大型語言模型,支援阿拉伯語和英語,在720億阿拉伯語標記和2790億英語/程式碼標記的資料集上進行訓練。阿拉伯語資料迭代了1.6個時代(相比英語/程式碼的1個時代),總計3950億個標記進行訓練。該模型基於Transformer解碼器專用架構(GPT-3),使用SwiGLU非線性啟用函式。它實現了ALiBi位置嵌入,可以外推到長序列長度,提供改進的上下文處理和模型精度。

需求人群:

["研究用途","商業用途,如聊天助手、客戶服務等"]

使用場景示例:

用作阿拉伯語自然語言處理研究的基礎模型

開發整合了阿拉伯語功能的應用程式

針對聊天助手等下游任務進行微調

產品特色:

支援阿拉伯語和英語的生成式對話

可針對特定下游任務進行微調

提供上下文感知能力

支援長序列生成

返回頂端