imp-v1-3b:一款強大的多模態小語言模型

Link:imp-v1-3b
Imp專案旨在提供一系列強大的多模態小語言模型(MSLMs)。我們的imp-v1-3b是一個擁有30億引數的強大MSLM,它建立在一個小而強大的SLM Phi-2(27億)和一個強大的視覺編碼器SigLIP(4億)之上,並在LLaVA-v1.5訓練集上進行了訓練。Imp-v1-3b在各種多模態基準測試中明顯優於類似模型規模的對手,甚至在各種多模態基準測試中表現略優於強大的LLaVA-7B模型。

需求人群:

"用於自然語言處理、視覺問答等多模態任務"

使用場景示例:

用於自然語言處理任務

用於視覺問答任務

用於多模態任務

產品特色:

提供強大的多模態小語言模型

具有30億引數

在多模態基準測試中表現優秀

返回頂端