VQAScore
V
Vqascore
紹介 :
Evaluating Text-to-Visual Generation with Image-to-Text Generationは、複雑なテキストからビジュアルへの生成効果をより適切に評価できる新しい評価指標VQAScoreを提案し、GenAI-Benchベンチマークテストセットを導入しました。VQAScoreはCLIP-FlanT5モデルに基づいており、テキストから画像?動画?3Dへの生成評価において最良の性能を達成し、CLIPScoreに代わる強力なソリューションです。GenAI-Benchは、多様な意味の組み合わせを含む現実的なシナリオのテストテキストを提供し、生成モデルの性能を包括的に評価するために使用できます。
ターゲットユーザー :
テキストからビジュアルへの生成モデルの評価と最適化に使用します。
総訪問数: 3.6K
最も高い割合の地域: US(100.00%)
ウェブサイト閲覧数 : 54.9K
使用シナリオ
DALL-E 3のテキストから画像への生成性能をVQAScoreで評価する
GenAI-Benchを使用して、複雑な意味の組み合わせシナリオにおける様々な生成モデルの性能をテストする
CLIP-FlanT5 VQAモデルに基づいて、テキストから動画への生成を自動評価する
製品特徴
テキストからビジュアルへの生成評価
VQAScore評価指標
CLIP-FlanT5 VQAモデル
GenAI-Benchベンチマークテストセット
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase