

Fuyu 8B
紹介 :
Fuyu-8BはAdept AIによって訓練された、マルチモーダルなテキストと画像変換モデルです。簡素化されたアーキテクチャとトレーニングプロセスにより、理解、拡張、展開が容易です。デジタルエージェント用に設計されており、任意の画像解像度に対応し、グラフや図表に関する質問への回答、UIに基づいた質問への回答、およびスクリーンショットの細粒度な位置特定が可能です。応答速度が速く、100ミリ秒以内に大型画像を処理できます。当社のユースケースに合わせて最適化されていますが、ビジュアルクエスチョン?アンサーや自然画像キャプションなどの標準的な画像理解ベンチマークでも良好な性能を示しています。公開されているモデルはベースモデルであることにご注意ください。冗長なキャプションやマルチモーダルチャットなど、具体的なユースケースに合わせてファインチューニングすることをお勧めします。当社の経験では、このモデルは少サンプル学習や様々なユースケースのファインチューニングに適しています。
ターゲットユーザー :
画像とテキストの生成シーンに適しています。
使用シナリオ
Cocoスタイルのキャプションの生成
画像に関する質問への回答
グラフに関する質問への回答
製品特徴
画像とテキストの生成に対応
任意の画像解像度に対応
グラフや図表に関する質問への回答
UIに基づいた質問への回答
スクリーンショットの細粒度な位置特定
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

剪映dreamina
剪映DreaminaはTikTok(抖音)が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。
AI画像生成
9.0M