Video MME : 首個全面評估多模態大型語言模型在視頻分析中的性能基準。

Video MME

簡介 :

Video-MME是一個專注於多模態大型語言模型（MLLMs）在視頻分析領域性能評估的基準測試。它填補了現有評估方法中對MLLMs處理連續視覺數據能力的空白，為研究者提供了一個高質量和全面的評估平臺。該基準測試覆蓋了不同長度的視頻，並針對MLLMs的核心能力進行了評估。

需求人群 :

Video-MME的目標受眾是人工智能領域的研究者和開發者，特別是那些專注於視頻理解和多模態交互的專業人士。它為這些用戶提供了一個標準化的測試平臺，幫助他們評估和改進自己的MLLMs模型。

總訪問量： 3.6K

佔比最多地區： US(86.53%)

本站瀏覽量： 74.0K

使用場景

Gemini 1.5 Pro在不同視頻長度和子類別中的準確度評分

GPT-4o和GPT-4V在視頻分析任務中的表現對比

LLaVA-NeXT-Video模型在不同視頻任務中的評分結果

產品特色

提供短、中、長視頻的準確度評分

包含6個主要領域和30個子類別的視頻類型

全面覆蓋視頻長度和任務類型

新收集並由人工標註的數據，非現有視頻數據集

提供視頻類別層級和視頻時長及任務類型分佈的統計信息

與其他基準測試進行比較，突出Video-MME的獨特優勢

使用教程

訪問Video-MME的官方網站

瞭解不同視頻長度和任務類型的評估標準

選擇感興趣的MLLMs模型進行性能測試

提交模型並獲取在不同視頻子類別中的表現結果

分析結果，與其他模型或基準進行比較

利用評估結果優化和改進MLLMs模型

精選AI產品推薦

智啟未來，您的人工智能解決方案智庫

直接訪問	48.40%	外鏈引薦	27.67%	郵件	0.04%
自然搜索	6.28%	社交媒體	16.60%	展示廣告	0.99%