SeamlessM4T
S
Seamlessm4t
簡介 :
SeamlessM4T是一款基於多模態模型的語音翻譯產品,支持近100種語言的自動語音識別、語音翻譯、文本翻譯、語音合成等功能。該產品採用了全新的多任務UnitY模型架構,能夠直接生成翻譯文本和語音。SeamlessM4T的自我監督語音編碼器w2v-BERT 2.0通過分析數百萬小時的多語言語音,學習如何在語音中找到結構和意義。該產品還提供了SONAR、SpeechLASER等多語言語音和文本數據集,以及fairseq2等序列建模工具包。SeamlessM4T的發佈,標誌著AI技術在實現語音翻譯方面取得了重大突破。
需求人群 :
SeamlessM4T可廣泛應用於語音翻譯、文本翻譯、語音合成等場景,適用於需要跨語言交流的個人、企業、政府機構等。
總訪問量: 2.2M
佔比最多地區: US(32.03%)
本站瀏覽量 : 63.8K
產品特色
支持近100種語言的自動語音識別
支持近100種語言的語音翻譯
支持近100種語言的文本翻譯
支持近100種語言的語音合成
支持36種語音語言的文本轉語音
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase