Florence-2-base:先進的視覺基礎模型,支援多種視覺和視覺-語言任務
Florence-2是由微軟開發的高階視覺基礎模型,採用基於提示的方法處理廣泛的視覺和視覺-語言任務。該模型能夠解釋簡單的文本提示,執行如描述、目標偵測和分割等任務。它利用包含54億個註釋的5.4億張影象的FLD-5B資料集,精通多工學習。模型的序列到序列架構使其在零樣本和微調設定中都表現出色,證明其為有競爭力的視覺基礎模型。
Florence-2是由微軟開發的高階視覺基礎模型,採用基於提示的方法處理廣泛的視覺和視覺-語言任務。該模型能夠解釋簡單的文本提示,執行如描述、目標偵測和分割等任務。它利用包含54億個註釋的5.4億張影象的FLD-5B資料集,精通多工學習。模型的序列到序列架構使其在零樣本和微調設定中都表現出色,證明其為有競爭力的視覺基礎模型。
Multi是一款專為軟體開發團隊設計的協作工具,它透過多人協作、共享控制、即時通訊和自動記錄等功能,幫助團隊成員更高效地溝通和工作。產品基於Zoom的高質量音影片基礎設施,提供低延遲的共享控制體驗,並透過AI技術自動生成會議摘要和行動項,進一步加速團隊的軟體開發流程。
通義靈碼是一款專為開發者設計的智慧編碼助手,支援多種開發環境,包括JetBrains IDEs、Visual Studio Code、Visual Studio等。它透過整合先進的AI技術,幫助開發者快速完成編碼任務,提高編碼效率和質量,適用於各種程式語言和開發場景。
MOFA-Video是一種能夠將單張圖片透過各種控制訊號動畫化的方法。它採用了稀疏到密集(S2D)運動生成和基於流的運動適應技術,可以有效地使用軌跡、關鍵點序列及其組合等不同型別的控制訊號來動畫化單張圖片。在訓練階段,透過稀疏運動取樣生成稀疏控制訊號,然後訓練不同的MOFA-Adapters來透過預訓練的SVD生成影片。在推理階段,不同的MOFA-Adapters可以組合起來共同控制凍結的SVD。
DUIX是一個開源的AI數字人智慧互動平臺,由矽基智慧打造。它允許開發者接入多種大模型和語音能力,實作數字人實時互動,並支援在Android和iOS多終端一鍵部署。DUIX適用於多種場景,包括捷運、銀行、政務等,具有低成本快速部署、小網路依賴和功能多樣化的特點。
SuperSonic是一個整合了由大型語言模型(LLM)驅動的Chat BI和由語義層驅動的Headless BI的下一代商業智慧(BI)平臺。它確保Chat BI能夠訪問與傳統BI相同的經過策劃和治理的語義資料模型。此外,這兩種範式的實作都從整合中受益:Chat BI的Text2SQL透過從語義模型中檢索上下文得到增強;Headless BI的查詢接口透過自然語言API得到擴充。SuperSonic提供了一個Chat BI介面,使使用者能夠使用自然語言查詢資料,並以適當的圖表視覺化結果。要實作這種體驗,唯一需要的就是透過Headless BI接口構建邏輯語義模型(定義指標/維度/標籤及其含義和關係)。同時,SuperSonic被設計為可擴充和可組合的,允許使用Java SPI新增和配置自訂實作。
OpenAgents是一個開放平臺,旨在使使用者和開發者能夠在日常生活中使用和託管語言代理。該平臺已經實作了三種代理:資料分析的Data Agent、整合200+日常工具的Plugins Agent和自動網頁瀏覽的Web Agent。OpenAgents透過最佳化的Web UI使普通使用者能夠與代理功能進行互動,同時為開發者和研究人員提供在本地設定上的無縫部署體驗,為創新語言代理的構建和現實世界評估提供了基礎。
DB-GPT是一個開源的AI原生資料應用開發框架,利用AWEL(Agentic Workflow Expression Language)和代理(agent)技術,簡化了大型模型應用與資料的結合。它透過多模型管理、Text2SQL效果最佳化、RAG框架最佳化、多代理框架協作等技術能力,使企業和開發者能夠以更少的程式碼構建定製化應用。DB-GPT在資料3.0時代,基於模型和資料庫,為構建企業級報告分析和業務洞察提供了基礎資料智慧技術。
Florence-2-large-ft是由微軟開發的高階視覺基礎模型,使用基於提示的方法來處理廣泛的視覺和視覺-語言任務。該模型能夠透過簡單的文本提示執行諸如影象描述、目標偵測和分割等任務。它利用FLD-5B資料集,包含54億個註釋,覆蓋1.26億張影象,實作多工學習。模型的序列到序列架構使其在零樣本和微調設定中均表現出色,證明其為有競爭力的視覺基礎模型。
june是一個結合了Ollama、Hugging Face Transformers和Coqui TTS Toolkit的本地語音聊天機器人。它提供了一種靈活、注重隱私的解決方案,可以在本地機器上進行語音輔助互動,確保沒有資料被髮送到外部伺服器。