AV HuBERT : 自监督学习框架，用于音视觉语音处理

AV HuBERT

简介 :

AV-HuBERT是一个自监督表示学习框架，专门用于音视觉语音处理。它在LRS3音视觉语音基准测试中实现了最先进的唇读、自动语音识别（ASR）和音视觉语音识别结果。该框架通过掩蔽多模态聚类预测来学习音视觉语音表示，并且提供了鲁棒的自监督音视觉语音识别。

需求人群 :

["音视觉语音识别研究","自动语音识别系统开发","多模态数据聚类分析"]

总访问量： 474.6M

占比最多地区： US(19.34%)

本站浏览量： 71.8K

使用场景

研究人员使用AV-HuBERT框架进行音视觉语音识别的实验研究

开发者利用AV-HuBERT模型开发能够理解不同语言环境下的语音识别应用

教育工作者使用AV-HuBERT辅助开发语言学习工具，提高学生的语言理解能力

产品特色

音视觉语音表示学习

掩蔽多模态聚类预测

自监督学习

唇读、ASR和音视觉语音识别

精选AI产品推荐

智启未来，您的人工智能解决方案智库

直接访问	51.61%	外链引荐	33.46%	邮件	0.04%
自然搜索	12.58%	社交媒体	2.19%	展示广告	0.11%