Link:imp-v1-3b
Imp專案旨在提供一系列強大的多模態小語言模型(MSLMs)。我們的imp-v1-3b是一個擁有30億引數的強大MSLM,它建立在一個小而強大的SLM Phi-2(27億)和一個強大的視覺編碼器SigLIP(4億)之上,並在LLaVA-v1.5訓練集上進行了訓練。Imp-v1-3b在各種多模態基準測試中明顯優於類似模型規模的對手,甚至在各種多模態基準測試中表現略優於強大的LLaVA-7B模型。
需求人群:
"用於自然語言處理、視覺問答等多模態任務"
使用場景示例:
用於自然語言處理任務
用於視覺問答任務
用於多模態任務
產品特色:
提供強大的多模態小語言模型
具有30億引數
在多模態基準測試中表現優秀