

Vqascore
簡介 :
Evaluating Text-to-Visual Generation with Image-to-Text Generation提出了一種新的評估指標VQAScore,能夠更好地評估複雜的文本到視覺生成效果,並引入了GenAI-Bench基準測試集。VQAScore基於CLIP-FlanT5模型,能夠在文本到圖像/視頻/3D生成評估中取得最佳性能,是一種強大的替代CLIPScore的方案。GenAI-Bench則提供了包含豐富組合語義的實際場景測試文本,可用於全面評估生成模型的性能。
需求人群 :
用於評估和優化文本到視覺生成模型
使用場景
使用VQAScore評估DALL-E 3的文本到圖像生成性能
利用GenAI-Bench測試不同生成模型在複雜組合語義場景下的表現
基於CLIP-FlanT5 VQA模型進行文本到視頻生成的自動評估
產品特色
文本到視覺生成評估
VQAScore評估指標
CLIP-FlanT5 VQA模型
GenAI-Bench基準測試集
精選AI產品推薦

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
中文精選

剪映dreamina
剪映Dreamina是抖音旗下的AIGC工具,用戶可以根據文本內容生成由AI生成的創意圖,支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作,豐富抖音在AI創造方面的內容庫。
AI圖像生成
9.1M