Pixtral 12B
P
Pixtral 12B
紹介 :
Pixtral 12Bは、Mistral AIチームが開発した多様なモダリティに対応するAIモデルです。自然画像と文書を理解し、優れた多様なモダリティのタスク処理能力を備えています。同時に、テキストのベンチマークテストでも最先端の性能を維持しています。様々な画像サイズとアスペクト比に対応し、長いコンテキストウィンドウ内で任意の数の画像を処理できます。Mistral Nemo 12Bのアップグレード版であり、多様なモダリティの推論用に設計されており、重要なテキスト処理能力を犠牲にすることはありません。
ターゲットユーザー :
Pixtral 12Bは、データアナリスト、研究者、開発者など、複雑な画像とテキスト処理が必要なユーザーに適しています。その多様なモダリティへの対応能力から、グラフ、文書、画像の処理に最適であり、同時にテキスト処理の高性能を維持しているので、テキストと画像間の複雑なインタラクションが必要なシナリオに適しています。
総訪問数: 5.6M
最も高い割合の地域: FR(36.13%)
ウェブサイト閲覧数 : 46.4K
使用シナリオ
Pixtral 12Bを使用してグラフや図表を分析し、データの傾向を理解します。
文書をアップロードして、文書の内容に関する複雑な質問に答えます。
複数の画像情報を組み合わせて、詳細なレポートまたはサマリーを生成します。
製品特徴
ネイティブな多様なモダリティに対応し、画像とテキストデータを交互に用いてトレーニングされています。
多様なモダリティのタスク、特に指示に従うタスクにおいて優れたパフォーマンスを発揮します。
テキストのベンチマークテストで最先端の性能を維持しています。
可変の画像サイズとアスペクト比に対応しています。
長いコンテキストウィンドウ内で複数の画像を処理できます。
新しいビジュアルエンコーダーにより、ネイティブで可変の画像サイズに対応しています。
多様なモダリティに対応するTransformerデコーダーにより、任意の数の画像を処理できます。
使用チュートリアル
Mistral AIのプラットフォームまたはLe ChatインターフェースでPixtral 12Bを試してみてください。
モデルリストからPixtral 12Bを選択し、処理する画像をアップロードします。
画像に関する質問または指示を提示すると、Pixtral 12Bは画像の内容に基づいて回答します。
APIコールを利用して、Pixtral 12Bを様々なアプリケーションやワークフローに統合します。
mistral-inferenceツールを使用して、ローカルでモデルを実行し、モデルファイルをダウンロードして読み込みます。
画像URLとテキストプロンプトを含むリクエストを作成し、モデルに処理のために送信します。
モデルの出力結果を取得し、必要に応じてさらに処理または表示します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase