LLaVA-3b
L
Llava 3b
简介 :
LLaVA-3b是一种基于Dolphin 2.6 Phi进行微调的模型,使用SigLIP 400M的视觉塔以LLaVA方式进行微调。模型具有多个图像标记、使用视觉编码器的最新层输出等特点。此模型基于Phi-2,受微软研究许可证约束,禁止商业使用。感谢ML Collective提供的计算资源积分。
需求人群 :
LLaVA-3b可用于图像描述生成、视觉问答等应用场景。
总访问量: 29.7M
占比最多地区: US(17.94%)
本站浏览量 : 60.7K
产品特色
模型微调
模型部署
在Transformers中使用
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase