InternVL:開源視覺基礎模型 基礎模型, 開源 InternVL透過將ViT模型擴充套件到60億引數並與語言模型對齊,構建出目前最大的14B開源視覺基礎模型,在視覺感知、跨模態檢索、多模態對話等廣泛任務上取得了32項state-of-the-art效能。