Vqascore : 用于评估文本到视觉生成的创新性指标和基准测试

Vqascore

AI图像生成 AI模型 #文本生成 #视觉生成 #评估指标 #基准测试普通产品开源

简介 :

Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一种新的评估指标VQAScore,能够更好地评估复杂的文本到视觉生成效果,并引入了GenAI-Bench基准测试集。VQAScore基于CLIP-FlanT5模型,能够在文本到图像/视频/3D生成评估中取得最佳性能,是一种强大的替代CLIPScore的方案。GenAI-Bench则提供了包含丰富组合语义的实际场景测试文本,可用于全面评估生成模型的性能。

需求人群 :

用于评估和优化文本到视觉生成模型

总访问量： 1.5K

占比最多地区： US(100.00%)

本站浏览量： 60.4K

使用场景

使用VQAScore评估DALL-E 3的文本到图像生成性能

利用GenAI-Bench测试不同生成模型在复杂组合语义场景下的表现

基于CLIP-FlanT5 VQA模型进行文本到视频生成的自动评估

产品特色

文本到视觉生成评估

VQAScore评估指标