大型語言模型 Archives - AI書籤-全球ai人工智慧產品和服務

WizardLM-2：新模型，多種型號，AI驅動合成資料訓練

WizardLM-2是WizardLM推出的新一代大型語言模型，包含三種型號：8x22B、70B和7B。該產品採用AI驅動的合成資料訓練系統，透過資料分析、加權抽樣、漸進式學習和AI互校AI等方法，最佳化模型效能。它能夠自動生成高品質的指令和響應，提供多樣化的對話能力，適用於多種程式設計和開發場景。

Prompto：開源的網路應用程式，旨在使與LLM的互動簡單高效

大型語言模型

Prompto是一個開源的網頁應用程式，旨在使與大型語言模型（LLMs）的互動簡單高效。它可以輕鬆切換不同的LLMs，透過調整溫度設定來調整LLM的創造力和風險水平，提供聊天機器人介面和筆記本介面，可以建立常用提示的范本，並且在瀏覽器中執行，確保流暢響應的體驗。

Andes：Andes – 大型語言模型（LLM）API市場

大型語言模型

Andes是一個大型語言模型（LLM）API市場，連線領先的人工智慧技術，提供自然語言處理、自動文字生成、翻譯等功能，為您的應用增加智慧能力。

Expert Specialized Fine-Tuning：定製化大型語言模型的專業微調工具

大型語言模型, 微調

Expert Specialized Fine-Tuning (ESFT) 是一種針對具有專家混合(MoE)架構的大型語言模型(LLMs)的高效定製化微調方法。它透過僅調整與任務相關的部分來最佳化模型效能，提高效率，同時減少資源和儲存的使用。

gemma-2-27b-it：輕量級、先進的文本生成模型

大型語言模型, 文本生成

Gemma是由Google開發的一系列輕量級、先進的開放模型，基於與Gemini模型相同的研究和技術構建。它們是文本到文本的解碼器僅大型語言模型，適用於多種文本生成任務，如問答、摘要和推理。Gemma模型的相對較小的尺寸使其能夠在資源有限的環境中部署，如筆記型電腦、桌面或您自己的雲基礎設施，使每個人都能接觸到最先進的AI模型，並促進創新。

Tele-FLM：52B引數的開源多語言大型語言模型

多語言支援, 大型語言模型

Tele-FLM（亦稱FLM-2）是一個52億引數的開源多語言大型語言模型，具有穩定高效的預訓練範式和增強的事實判斷能力。基於解碼器僅變換器架構，已在大約2T的token上進行訓練。Tele-FLM在同等規模上展現出優越的效能，有時甚至超越了更大的模型。除了分享模型權重外，我們還提供了核心設計、工程實踐和訓練細節，期待它們對學術界和工業界社群都有所裨益。