JetMoE-8B:以低成本實作高效能的大型語言模型

Link:jetmoe-8b
JetMoE-8B是一個開源的大型語言模型,透過使用公共資料集和最佳化的訓練方法,以低於10萬美元的成本實作了超越Meta AI LLaMA2-7B的效能。該模型在推理時僅啟用22億引數,大幅降低了計算成本,同時保持了優異的效能。

需求人群:

"適用於學術研究、自然語言處理、文本生成等多種場景"

使用場景示例:

在學術研究中進行語言模型效能對比分析

用於自然語言處理任務,如文本摘要、問答系統

作為文本生成工具,創作文章或編寫程式碼

產品特色:

文本生成

因果語言模型

序列分類

模型微調

返回頂端