Mini-Gemini
M
Mini Gemini
紹介 :
Mini-Geminiは、香港中文大学終身教授の賈佳亞教授のチームによって開発されたマルチモーダルモデルです。正確な画像理解能力と高品質のトレーニングデータを持ちます。画像推論と生成を組み合わせ、様々な規模のバージョンを提供しており、その性能はGPT-4やDALLE-3に匹敵します。Mini-Geminiは、Geminiのビジュアルデュアルブランチ情報マイニング方法とSDXL技術を採用し、畳み込みニューラルネットワークで画像をエンコードし、Attention機構を用いて情報を抽出し、同時にLLMを用いてテキストを生成することで、2つのモデルを連携させています。
ターゲットユーザー :
高解像度の画像を解析し、画像形式で表現する必要があるタスクに適しています。例えば、パン作りの工程説明、パソコンの画像パラメータ比較など。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 163.4K
使用シナリオ
画像の内容に基づいてパンを作る手順を説明する
パソコンの画像パラメータを比較する
毛糸のクマの画像を生成する
製品特徴
画像理解と生成
高解像度画像処理
マルチモーダル入力処理
テキストプロンプトによる画像生成
画像内容分析と比較
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase