LLM Archives - Page 4 of 5 - AI書籤-全球ai人工智慧產品和服務

LLM Context Extender：擴充套件LLM上下文視窗

LLM Context Extender是一款旨在擴充套件大型語言模型（LLMs）上下文視窗的工具。它透過調整RoPE的基礎頻率和縮放注意力logits的方式，幫助LLMs有效適應更大的上下文視窗。該工具在精細調整效能和穩健性方面驗證了其方法的優越性，並展示了在僅有100個樣本和6個訓練步驟的情況下，將LLaMA-2-7B-Chat的上下文視窗擴充套件到16,384的非凡效率。此外，還探討了資料組成和訓練課程如何影響特定下游任務的上下文視窗擴充套件，建議以長對話進行LLMs的精細調整作為良好的起點。

Efficient LLM：高效的 Intel GPU 上的 LLM 推理解決方案

LLM, 推理

這是一種在 Intel GPU 上實現的高效的 LLM 推理解決方案。透過簡化 LLM 解碼器層、使用分段 KV 快取策略和自定義的 Scaled-Dot-Product-Attention 核心，該解決方案在 Intel GPU 上相比標準的 HuggingFace 實現可實現高達 7 倍的令牌延遲降低和 27 倍的吞吐量提升。詳細功能、優勢、定價和定位等資訊請參考官方網站。

Confident AI：開源評估基礎設施，為 LLM 提供信心

LLM, 評估基礎設施

Confident AI 是一個開源的評估基礎設施，為 LLM（Language Model）提供信心。使用者可以透過編寫和執行測試用例來評估自己的 LLM 應用，並使用豐富的開源指標來衡量其效能。透過定義預期輸出並與實際輸出進行比較，使用者可以確定 LLM 的表現是否符合預期，並找出改進的方向。Confident AI 還提供了高階的差異跟蹤功能，幫助使用者最佳化 LLM 配置。此外，使用者還可以利用全面的分析功能，識別重點關注的用例，實現 LLM 的有信心地投產。Confident AI 還提供了強大的功能，幫助使用者自信地將 LLM 投入生產，包括 A/B 測試、評估、輸出分類、報告儀表盤、資料集生成和詳細監控。