Link:bunny
Bunny 是一系列輕量級但功能強大的多模態模型,提供多種即插即用的視圖編碼器和語言主幹網路。透過從更廣泛的資料來源進行精選選擇,構建更豐富的訓練資料,以補償模型尺寸的減小。Bunny-v1.0-3B 模型在效能上超越了同類大小甚至更大的 MLLMs(7B)模型,並與 13B 模型效能相當。
需求人群:
["適用於需要進行多模態學習和處理的開發者和研究人員。","適合在資源受限的環境下部署高效的 AI 模型。","為中文和英文環境下的多模態任務提供支援。","適用於希望利用輕量級模型進行影象和語言任務的使用者。"]
使用場景示例:
用於影象和文本的聯合理解和生成任務。
在聊天機器人中結合影象理解提供更豐富的使用者體驗。
作為多模態資料處理的後端模型,支援各種智慧應用。
產品特色:
提供多種視覺編碼器選擇,如 EVA-CLIP、SigLIP。
支援多種語言主幹網路,包括 Llama-3-8B、Phi-1.5 等。
透過精選資料來源構建更豐富的訓練資料。
Bunny-v1.0-3B 模型在多語言環境下表現優異。
Bunny-Llama-3-8B-V 模型基於 Llama-3,展示出卓越的效能。
支援在 HuggingFace、ModelScope 和 wisemodel 平臺上查詢更多細節。
提供了針對中文問答能力的模型,如 Bunny-v1.0-3B-zh 和 Bunny-v1.0-2B-zh。