

Vqascore
紹介 :
Evaluating Text-to-Visual Generation with Image-to-Text Generationは、複雑なテキストからビジュアルへの生成効果をより適切に評価できる新しい評価指標VQAScoreを提案し、GenAI-Benchベンチマークテストセットを導入しました。VQAScoreはCLIP-FlanT5モデルに基づいており、テキストから画像?動画?3Dへの生成評価において最良の性能を達成し、CLIPScoreに代わる強力なソリューションです。GenAI-Benchは、多様な意味の組み合わせを含む現実的なシナリオのテストテキストを提供し、生成モデルの性能を包括的に評価するために使用できます。
ターゲットユーザー :
テキストからビジュアルへの生成モデルの評価と最適化に使用します。
使用シナリオ
DALL-E 3のテキストから画像への生成性能をVQAScoreで評価する
GenAI-Benchを使用して、複雑な意味の組み合わせシナリオにおける様々な生成モデルの性能をテストする
CLIP-FlanT5 VQAモデルに基づいて、テキストから動画への生成を自動評価する
製品特徴
テキストからビジュアルへの生成評価
VQAScore評価指標
CLIP-FlanT5 VQAモデル
GenAI-Benchベンチマークテストセット
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

剪映dreamina
剪映DreaminaはTikTok(抖音)が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。
AI画像生成
9.0M