AV-HuBERT
A
AV HuBERT
簡介 :
AV-HuBERT是一個自監督表示學習框架,專門用於音視覺語音處理。它在LRS3音視覺語音基準測試中實現了最先進的唇讀、自動語音識別(ASR)和音視覺語音識別結果。該框架通過掩蔽多模態聚類預測來學習音視覺語音表示,並且提供了魯棒的自監督音視覺語音識別。
需求人群 :
["音視覺語音識別研究","自動語音識別系統開發","多模態數據聚類分析"]
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 67.1K
使用場景
研究人員使用AV-HuBERT框架進行音視覺語音識別的實驗研究
開發者利用AV-HuBERT模型開發能夠理解不同語言環境下的語音識別應用
教育工作者使用AV-HuBERT輔助開發語言學習工具,提高學生的語言理解能力
產品特色
音視覺語音表示學習
掩蔽多模態聚類預測
自監督學習
唇讀、ASR和音視覺語音識別
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase