Parler-TTS
P
Parler TTS
簡介 :
Parler-TTS 是一個由 Hugging Face 開發的輕量級文本轉語音(TTS)模型,能夠以給定說話者的風格(性別、音調、說話風格等)生成高質量、自然 sounding 的語音。它是基於 Dan Lyth 和 Simon King 發表的論文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作復現,兩位作者分別來自 Stability AI 和愛丁堡大學。與其他TTS模型不同,Parler-TTS 完全開源發佈,包括數據集、預處理、訓練代碼和權重。功能包括:生成高質量且自然 sounding 的語音輸出、靈活的使用和部署、提供豐富的註釋語音數據集。定價:免費。
需求人群 :
可用於生成自然 sounding 的語音,定製特定說話者風格,提供豐富的註釋語音數據集。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 188.0K
使用場景
用於定製化說話者風格的語音生成
快速部署並使用自然 sounding 的語音輸出
訓練和改進TTS模型的豐富資源
產品特色
生成高質量且自然 sounding 的語音輸出
根據給定說話者的風格進行定製
易於使用的安裝和部署方法
提供開源註釋語音數據集
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase