深度學習

VASA-1:實時生成逼真語音驅動人臉

VASA-1是由微軟研究院開發的一個模型,專注於實時生成與音訊相匹配的逼真人臉動畫。該技術透過深度學習演算法,能夠根據輸入的語音內容,自動生成相應的口型和麵部表情,為使用者提供一種全新的互動體驗。

XTuner:高效靈活的大規模模型微調工具包

XTuner是一個為大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)設計的高效、靈活且功能齊全的微調工具包。它支援在幾乎所有GPU上進行LLM和VLM的預訓練和微調,能夠自動排程高效能操作,如FlashAttention和Triton核心,以提高訓練吞吐量。XTuner與DeepSpeed相容,支援多種ZeRO最佳化技術。

LAMDA-TALENT:綜合表格資料學習工具箱和基準測試

LAMDA-TALENT是一個綜合的表格資料分析工具箱和基準測試平臺,它整合了20多種深度學習方法、10多種傳統方法以及300多個多樣化的表格資料集。該工具箱旨在提高模型在表格資料上的效能,提供強大的預處理能力,最佳化資料學習,並支援使用者友好和適應性強的操作,適用於新手和專家資料科學家。

Understanding Deep Learning:深入理解深度學習的原理與應用

《Understanding Deep Learning》是一本深入探討深度學習原理和應用的書籍。它提供了豐富的數學背景知識、監督學習、神經網路的構建與訓練等深度學習領網域的全面內容。書中提供的Python筆記本練習幫助讀者透過實踐來加深理解。此外,還有為教師提供的資源,包括影象、投影片和教輔材料。

LLM Compiler-13b:先進的編譯器最佳化大型語言模型

Meta Large Language Model Compiler (LLM Compiler-13b) 是基於Code Llama構建的,專注於程式碼最佳化和編譯器推理的先進大型語言模型。它在編譯器最佳化任務上展現出比現有公開可用的大型語言模型更強的理解能力,能夠完美模擬編譯器輸出20%的時間。LLM Compiler提供了兩種模型尺寸:7B和13B引數,針對不同的服務和延遲需求進行了訓練。該模型是免費的,適用於研究和商業用途,旨在支援編譯器研究人員和工程師,並激發創新工具的開發。

返回頂端