AV HuBERT : 自監督學習框架，用於音視覺語音處理

AV HuBERT

簡介 :

AV-HuBERT是一個自監督表示學習框架，專門用於音視覺語音處理。它在LRS3音視覺語音基準測試中實現了最先進的唇讀、自動語音識別（ASR）和音視覺語音識別結果。該框架通過掩蔽多模態聚類預測來學習音視覺語音表示，並且提供了魯棒的自監督音視覺語音識別。

需求人群 :

["音視覺語音識別研究","自動語音識別系統開發","多模態數據聚類分析"]

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 67.1K

使用場景

研究人員使用AV-HuBERT框架進行音視覺語音識別的實驗研究

開發者利用AV-HuBERT模型開發能夠理解不同語言環境下的語音識別應用

教育工作者使用AV-HuBERT輔助開發語言學習工具，提高學生的語言理解能力

產品特色

音視覺語音表示學習

掩蔽多模態聚類預測

自監督學習

唇讀、ASR和音視覺語音識別

精選AI產品推薦

智啟未來，您的人工智能解決方案智庫

直接訪問	51.61%	外鏈引薦	33.46%	郵件	0.04%
自然搜索	12.58%	社交媒體	2.19%	展示廣告	0.11%