InternVL
I
Internvl
紹介 :
InternVLは、ViTモデルを60億パラメーターに拡張し、言語モデルとアライメントさせることで、現在最大の140億パラメーターのオープンソースビジョン基礎モデルを構築しました。これにより、視覚認識、クロスモーダル検索、マルチモーダル対話など幅広いタスクにおいて、32項目もの最先端性能を達成しています。
ターゲットユーザー :
["コンピュータビジョン研究","マルチモーダルアプリケーション開発"]
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 151.0K
使用シナリオ
InternViT-6Bを用いた画像分類
InternVL-Cを用いた画像テキスト検索
InternVL-Chatを用いたビジュアルQ&A
製品特徴
画像分類
セマンティックセグメンテーション
動画分類
画像テキスト検索
ビジョン言語モデリング
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase