Vqascore : テキストからビジュアルを生成する際の創造性を評価するための指標およびベンチマークテストです。

Vqascore

AI画像生成 AIモデル #テキスト生成 #ビジュアル生成 #評価指標 #ベンチマークテスト通常製品オープンソース

紹介 :

Evaluating Text-to-Visual Generation with Image-to-Text Generationは、複雑なテキストからビジュアルへの生成効果をより適切に評価できる新しい評価指標VQAScoreを提案し、GenAI-Benchベンチマークテストセットを導入しました。VQAScoreはCLIP-FlanT5モデルに基づいており、テキストから画像?動画?3Dへの生成評価において最良の性能を達成し、CLIPScoreに代わる強力なソリューションです。GenAI-Benchは、多様な意味の組み合わせを含む現実的なシナリオのテストテキストを提供し、生成モデルの性能を包括的に評価するために使用できます。

ターゲットユーザー :

テキストからビジュアルへの生成モデルの評価と最適化に使用します。

総訪問数： 3.6K

最も高い割合の地域： US(100.00%)

ウェブサイト閲覧数： 54.9K

使用シナリオ

DALL-E 3のテキストから画像への生成性能をVQAScoreで評価する

GenAI-Benchを使用して、複雑な意味の組み合わせシナリオにおける様々な生成モデルの性能をテストする

CLIP-FlanT5 VQAモデルに基づいて、テキストから動画への生成を自動評価する

製品特徴

テキストからビジュアルへの生成評価

VQAScore評価指標