Link:jetmoe-8b
JetMoE-8B是一個開源的大型語言模型,透過使用公共資料集和最佳化的訓練方法,以低於10萬美元的成本實作了超越Meta AI LLaMA2-7B的效能。該模型在推理時僅啟用22億引數,大幅降低了計算成本,同時保持了優異的效能。
需求人群:
"適用於學術研究、自然語言處理、文本生成等多種場景"
使用場景示例:
在學術研究中進行語言模型效能對比分析
用於自然語言處理任務,如文本摘要、問答系統
作為文本生成工具,創作文章或編寫程式碼
產品特色:
文本生成
因果語言模型
序列分類
模型微調