LoRA

Llama-3 70B Gradient 524K Adapter：Llama-3 70B模型的LoRA介面卡，擴充套件上下文長度至超過524K

Llama-3 70B Gradient 524K Adapter是一個基於Llama-3 70B模型的適配器，由Gradient AI Team開發，旨在透過LoRA技術擴充模型的上下文長度至524K，從而提升模型在處理長文本資料時的效能。該模型使用了先進的訓練技術，包括NTK-aware插值和RingAttention庫，以高效地在高效能運算叢集上進行訓練。

mistral-finetune：輕量級程式碼庫，用於高效微調Mistral模型

LoRA, 微調

mistral-finetune是一個輕量級的程式碼庫，它基於LoRA訓練範式，允許在凍結大部分權重的情況下，只訓練1-2%的額外權重，以低秩矩陣微擾的形式進行微調。它被最佳化用於多GPU單節點訓練設定，對於較小模型，例如7B模型，單個GPU就足夠了。