moondream
M
Moondream
簡介 :
moondream是一個使用SigLIP、Phi-1.5和LLaVA訓練數據集構建的16億參數模型。由於使用了LLaVA數據集,權重受CC-BY-SA許可證保護。您可以在Huggingface Spaces上嘗試使用它。該模型在VQAv2、GQA、VizWiz和TextVQA基準測試中表現如下:LLaVA-1.5(13.3B參數):80.0、63.3、53.6、61.3;LLaVA-1.5(7.3B參數):78.5、62.0、50.0、58.2;MC-LLaVA-3B(3B參數):64.2、49.6、24.9、38.6;LLaVA-Phi(3B參數):71.4、-、35.9、48.6;moondream1(1.6B參數):74.3、56.3、30.3、39.8。
需求人群 :
您可以使用moondream模型進行圖像問答、視覺理解等任務。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 64.9K
產品特色
使用SigLIP、Phi-1.5和LLaVA訓練數據集構建的16億參數模型
權重受CC-BY-SA許可證保護
在Huggingface Spaces上可用
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase