LongRoPE:將LLM上下文視窗擴充套件至200萬令牌的技術

Link:longrope
LongRoPE是微軟推出的技術,可以將預訓練大型語言模型(LLM)的上下文視窗擴充套件到2048k(200萬)令牌,實現從短上下文到長上下文的擴充套件,降低訓練成本和時間,同時保持原有短上下文視窗效能。適用於提高語言模型在長文字上的理解和生成能力,提升機器閱讀理解、文字摘要和長篇文章生成等任務。

需求人群:

"適用於需要處理極長文字的任務,提高語言模型在長文字上的理解和生成能力,提升機器閱讀理解、文字摘要和長篇文章生成等任務的效能。"

使用場景示例:

用於機器閱讀理解任務,提高模型在長文字上的理解能力。

應用於文字摘要生成,提升自動摘要生成效果。

支援長篇文章生成,使模型能夠更好地處理大篇幅文字。

產品特色:

擴充套件上下文視窗至200萬令牌

低成本微調

保持短上下文效能

返回頂端