InternVL
I
Internvl
簡介 :
InternVL通過將ViT模型擴展到60億參數並與語言模型對齊,構建出目前最大的14B開源視覺基礎模型,在視覺感知、跨模態檢索、多模態對話等廣泛任務上取得了32項state-of-the-art性能。
需求人群 :
["計算機視覺研究","多模態應用開發"]
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 152.4K
使用場景
使用InternViT-6B進行圖像分類
使用InternVL-C進行圖像文本檢索
使用InternVL-Chat進行視覺問答
產品特色
圖像分類
語義分割
視頻分類
圖像文字檢索
視覺語言建模
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase