Llava 3b : LLaVA-3b是一種基於Dolphin 2.6 Phi進行微調的模型，使用SigLIP 400M的視覺塔以LLaVA方式進行微調。模型具有多個圖像標記、使用視覺編碼器的最新層輸出等特點。

Llava 3b

LLaVA-3b

Llava 3b

AI模型 AI圖像生成 #Hugging Face #LLaVA-3b #模型微調 #視覺編碼器 #圖像描述生成普通產品開源

簡介 :

LLaVA-3b是一種基於Dolphin 2.6 Phi進行微調的模型，使用SigLIP 400M的視覺塔以LLaVA方式進行微調。模型具有多個圖像標記、使用視覺編碼器的最新層輸出等特點。此模型基於Phi-2，受微軟研究許可證約束，禁止商業使用。感謝ML Collective提供的計算資源積分。

需求人群 :

LLaVA-3b可用於圖像描述生成、視覺問答等應用場景。

總訪問量： 29.7M

佔比最多地區： US(17.94%)

本站瀏覽量： 57.1K

產品特色

模型微調

模型部署

在Transformers中使用

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

剪映Dreamina

剪映Dreamina是抖音旗下的AIGC工具，用戶可以根據文本內容生成由AI生成的創意圖，支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作，豐富抖音在AI創造方面的內容庫。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase