Video-MME
V
Video MME
簡介 :
Video-MME是一個專注於多模態大型語言模型(MLLMs)在視頻分析領域性能評估的基準測試。它填補了現有評估方法中對MLLMs處理連續視覺數據能力的空白,為研究者提供了一個高質量和全面的評估平臺。該基準測試覆蓋了不同長度的視頻,並針對MLLMs的核心能力進行了評估。
需求人群 :
Video-MME的目標受眾是人工智能領域的研究者和開發者,特別是那些專注於視頻理解和多模態交互的專業人士。它為這些用戶提供了一個標準化的測試平臺,幫助他們評估和改進自己的MLLMs模型。
總訪問量: 3.6K
佔比最多地區: US(86.53%)
本站瀏覽量 : 74.0K
使用場景
Gemini 1.5 Pro在不同視頻長度和子類別中的準確度評分
GPT-4o和GPT-4V在視頻分析任務中的表現對比
LLaVA-NeXT-Video模型在不同視頻任務中的評分結果
產品特色
提供短、中、長視頻的準確度評分
包含6個主要領域和30個子類別的視頻類型
全面覆蓋視頻長度和任務類型
新收集並由人工標註的數據,非現有視頻數據集
提供視頻類別層級和視頻時長及任務類型分佈的統計信息
與其他基準測試進行比較,突出Video-MME的獨特優勢
使用教程
訪問Video-MME的官方網站
瞭解不同視頻長度和任務類型的評估標準
選擇感興趣的MLLMs模型進行性能測試
提交模型並獲取在不同視頻子類別中的表現結果
分析結果,與其他模型或基準進行比較
利用評估結果優化和改進MLLMs模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase