LLaVA-3b
L
Llava 3b
紹介 :
LLaVA-3bは、Dolphin 2.6 Phiをファインチューニングしたモデルです。SigLIP 400Mのビジョнтаワーを用いて、LLaVA方式でファインチューニングされています。複数の画像ラベル、ビジョンエンコーダの最終層出力などを特徴としています。このモデルはPhi-2をベースとしており、マイクロソフトリサーチライセンスの制約を受け、商用利用は禁止されています。ML Collectiveによる計算リソースクレジットへの感謝を述べます。
ターゲットユーザー :
LLaVA-3bは、画像キャプション生成、ビジュアルクエスチョン?アンサーリングなどのアプリケーションシナリオで使用できます。
総訪問数: 26.1M
最も高い割合の地域: US(17.94%)
ウェブサイト閲覧数 : 58.0K
製品特徴
モデルファインチューニング
モデルデプロイ
Transformersでの使用
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase