VQAScore
V
Vqascore
简介 :
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。
需求人群 :
用于评估和优化文本到视觉生成模型
总访问量: 1.5K
占比最多地区: US(100.00%)
本站浏览量 : 60.2K
使用场景
使用VQAScore评估DALL-E 3的文本到图像生成性能
利用GenAI-Bench测试不同生成模型在复杂组合语义场景下的表现
基于CLIP-FlanT5 VQA模型进行文本到视频生成的自动评估
产品特色
文本到视觉生成评估
VQAScore评估指标
CLIP-FlanT5 VQA模型
GenAI-Bench基准测试集
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase