模型微調 Archives - AI書籤-全球ai人工智慧產品和服務

ALMA-13B-R：先進的機器翻譯模型

ALMA-R模型，透過Contrastive Preference Optimization (CPO)進行了進一步的LoRA微調，超越了GPT-4和WMT獲獎者。使用者可以在GitHub倉庫中下載ALMA(-R)模型和資料集。ALMA-R建立在ALMA模型的基礎上，採用了我們提出的Contrastive Preference Optimization (CPO)進行微調，而不是ALMA中使用的Supervised Fine-tuning。CPO微調需要我們的三元組偏好資料進行偏好學習。ALMA-R現在可以匹配甚至超越GPT-4或WMT獲獎者！

Windows AI Studio：Windows AI Studio簡化生成式AI應用程式開發

Windows AI Studio透過彙集來自Azure AI Studio和其他目錄（如Hugging Face）的尖端AI開發工具和模型，簡化了生成式AI應用程式的開發。它使開發人員能夠對本地應用程式中使用的最新小語言模型（SLMs）進行微調、定製和部署。它提供端到端的引導式工作區設定，包括模型配置UI和引導式步驟，以微調流行的SLMs（如Phi）和最先進的模型（如Llama 2和Mistral）。