

Imp V1 3b
紹介 :
Impプロジェクトは、一連の強力なマルチモーダル小型言語モデル(MSLM)を提供することを目指しています。私たちのimp-v1-3bは、30億パラメーターを持つ強力なMSLMであり、小型ながらも強力なSLMであるPhi-2(27億パラメーター)と強力なビジュアルエンコーダーであるSigLIP(4億パラメーター)を基盤とし、LLaVA-v1.5トレーニングセットでトレーニングされています。imp-v1-3bは、様々なマルチモーダルベンチマークテストにおいて、同規模の競合モデルを明らかに上回り、いくつかのマルチモーダルベンチマークテストでは、強力なLLaVA-7Bモデルをわずかに上回る性能を示しています。
ターゲットユーザー :
自然言語処理、視覚的な質問応答などのマルチモーダルタスクに使用されます
使用シナリオ
自然言語処理タスクに使用
視覚的な質問応答タスクに使用
マルチモーダルタスクに使用
製品特徴
強力なマルチモーダル小型言語モデルを提供する
30億パラメーターを持つ
マルチモーダルベンチマークテストで優れた性能を発揮する
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

剪映dreamina
剪映DreaminaはTikTok(抖音)が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。
AI画像生成
9.0M