Expert Specialized Fine-Tuning：定製化大型語言模型的專業微調工具

連結：https://github.com/deepseek-ai/ESFT

Expert Specialized Fine-Tuning (ESFT) 是一種針對具有專家混合(MoE)架構的大型語言模型(LLMs)的高效定製化微調方法。它透過僅調整與任務相關的部分來最佳化模型效能，提高效率，同時減少資源和儲存的使用。

需求人群：

使用場景示例：

產品特色：

使用教學：

1. 克隆或下載 ESFT 專案到本地。

2. 進入 esft 目錄，安裝所需的依賴項。

3. 下載必要的適配器以適配不同的大型語言模型。

4. 使用 eval.py 腳本來評估模型在特定資料集上的效能。

5. 根據評估結果，使用 get_expert_scores.py 腳本來計算專家分數。

6. 使用 generate_expert_config.py 腳本來生成配置，最佳化模型結構。

7. 根據生成的配置調整模型，進行進一步的訓練和測試。

其他相關AI產品