MiniGPT4-Video
M
Minigpt4 Video
简介 :
MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。基于MiniGPT-v2,结合视觉主干EVA-CLIP,训练多阶段阶段,包括大规模视频-文本预训练和视频问题解答微调。在MSVD、MSRVTT、TGIF和TVQA基准上取得显著提升。定价未知。
需求人群 :
适用于理解复杂视频,生成文本描述,回答视频问答。
总访问量: 1.9K
占比最多地区: US(100.00%)
本站浏览量 : 108.7K
使用场景
上传宝格丽宣传视频,模型生成标题与宣传语。
上传虚幻引擎视频,模型理解特效处理。
上传花朵盛开视频,模型作超美抒情诗。
产品特色
理解视频内容
配标题、宣传语
视频问答
提取视频要义
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase