LLaVA-3b
L
Llava 3b
簡介 :
LLaVA-3b是一種基於Dolphin 2.6 Phi進行微調的模型,使用SigLIP 400M的視覺塔以LLaVA方式進行微調。模型具有多個圖像標記、使用視覺編碼器的最新層輸出等特點。此模型基於Phi-2,受微軟研究許可證約束,禁止商業使用。感謝ML Collective提供的計算資源積分。
需求人群 :
LLaVA-3b可用於圖像描述生成、視覺問答等應用場景。
總訪問量: 29.7M
佔比最多地區: US(17.94%)
本站瀏覽量 : 57.1K
產品特色
模型微調
模型部署
在Transformers中使用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase