Vqascore : 用於評估文本到視覺生成的創新性指標和基準測試

Vqascore

AI圖像生成 AI模型 #文本生成 #視覺生成 #評估指標 #基準測試普通產品開源

簡介 :

Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一種新的評估指標VQAScore,能夠更好地評估複雜的文本到視覺生成效果,並引入了GenAI-Bench基準測試集。VQAScore基於CLIP-FlanT5模型,能夠在文本到圖像/視頻/3D生成評估中取得最佳性能,是一種強大的替代CLIPScore的方案。GenAI-Bench則提供了包含豐富組合語義的實際場景測試文本,可用於全面評估生成模型的性能。

需求人群 :

用於評估和優化文本到視覺生成模型

總訪問量： 1.5K

佔比最多地區： US(100.00%)

本站瀏覽量： 58.0K

使用場景

使用VQAScore評估DALL-E 3的文本到圖像生成性能

利用GenAI-Bench測試不同生成模型在複雜組合語義場景下的表現

基於CLIP-FlanT5 VQA模型進行文本到視頻生成的自動評估

產品特色

文本到視覺生成評估

VQAScore評估指標