AV-HuBERT
A
AV HuBERT
简介 :
AV-HuBERT是一个自监督表示学习框架,专门用于音视觉语音处理。它在LRS3音视觉语音基准测试中实现了最先进的唇读、自动语音识别(ASR)和音视觉语音识别结果。该框架通过掩蔽多模态聚类预测来学习音视觉语音表示,并且提供了鲁棒的自监督音视觉语音识别。
需求人群 :
["音视觉语音识别研究","自动语音识别系统开发","多模态数据聚类分析"]
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 71.8K
使用场景
研究人员使用AV-HuBERT框架进行音视觉语音识别的实验研究
开发者利用AV-HuBERT模型开发能够理解不同语言环境下的语音识别应用
教育工作者使用AV-HuBERT辅助开发语言学习工具,提高学生的语言理解能力
产品特色
音视觉语音表示学习
掩蔽多模态聚类预测
自监督学习
唇读、ASR和音视觉语音识别
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase