語言模型 Archives - Page 4 of 8 - AI書籤-全球ai人工智慧產品和服務

Web LLM：將大型語言模型和聊天引入到 Web 瀏覽器中

Web LLM 是一個模組化、可定製的 JavaScript 包，可直接將語言模型聊天引入到 Web 瀏覽器中。一切都在瀏覽器內部執行，無需伺服器支援，並且透過 WebGPU 進行加速。它可以為大家構建 AI 助手提供很多有趣的機會，並在享受 GPU 加速時保護隱私。此專案是 MLC LLM 的附屬專案，MLC LLM 可以在 iPhone 和其他本地環境中本地執行 LLM。

imp-v1-3b：一款強大的多模態小語言模型

多模態, 語言模型

Imp專案旨在提供一系列強大的多模態小語言模型（MSLMs）。我們的imp-v1-3b是一個擁有30億引數的強大MSLM，它建立在一個小而強大的SLM Phi-2（27億）和一個強大的視覺編碼器SigLIP（4億）之上，並在LLaVA-v1.5訓練集上進行了訓練。Imp-v1-3b在各種多模態基準測試中明顯優於類似模型規模的對手，甚至在各種多模態基準測試中表現略優於強大的LLaVA-7B模型。

Qwen-VL 是阿里雲推出的通用型視覺語言模型,具有強大的視覺理解和多模態推理能力。它支援零樣本影象描述、視覺問答、文字理解、影象地標定位等任務,在多個視覺基準測試中達到或超過當前最優水平。該模型採用 Transformer 結構,以 7B 引數規模進行預訓練,支援 448×448 解析度,可以端到端處理影象與文字的多模態輸入與輸出。Qwen-VL 的優勢包括通用性強、支援多語種、細粒度理解等。它可以廣泛應用於影象理解、視覺問答、影象標註、圖文生成等任務。

OLMo：開源語言模型和訓練框架

語言模型, 開源

OLMo是一個開源的語言模型和訓練框架,由AI2研究院釋出。它提供了完整的訓練資料、程式碼、模型引數、評估程式碼等資源,使研究人員能夠訓練並實驗大規模語言模型。OLMo的優勢在於真正開放,使用者可以訪問從資料到模型的完整資訊,輔以豐富的檔案,便於研究人員進行開放式研究和協作。該框架降低了語言模型研究的門檻,使更多人參與進來推動語言模型技術進步。

Lepton Search：Lepton是一個開源的語言模型搜尋平臺

語言模型, 開源

Lepton是一個開源的自然語言處理平臺,提供語言理解、生成和推理能力。它採用Transformer模型架構,能夠進行多輪對話、問答、文字生成等任務。Lepton具有高效、可擴充套件的特點,可以在多個領域部署使用。

Patchscope：語言模型隱藏表示檢查統一框架

可解釋性, 語言模型

Patchscope是一個用於檢查大型語言模型（LLM）隱藏表示的統一框架。它能解釋模型行為，驗證其與人類價值觀的一致性。透過利用模型本身生成人類可理解的文字，我們提出利用模型本身來解釋其自然語言內部表示。我們展示了Patchscopes框架如何用於回答關於LLM計算的廣泛研究問題。我們發現，基於將表示投影到詞彙空間和干預LLM計算的先前可解釋性方法，可以被視為此框架的特殊例項。此外，Patchscope還開闢了新的可能性，例如使用更強大的模型來解釋較小模型的表示，並解鎖了自我糾正等新應用，如多跳推理。

Web LLM：將大型語言模型和聊天引入到 Web 瀏覽器中

imp-v1-3b：一款強大的多模態小語言模型

Qwen-VL：通用型視覺語言模型

OLMo：開源語言模型和訓練框架

Lepton Search：Lepton是一個開源的語言模型搜尋平臺

Patchscope：語言模型隱藏表示檢查統一框架

Moonvalley：創造令人驚歎的影片和動畫

Cappy：一款小型評分器,提升大型多工語言模型效能

KarpathyLLMChallenge：深入理解語言模型中的標記化過程

LaVi-Bridge：連線不同語言模型和生成視覺模型進行文字到影象生成