Stability AI Text To Speech Models : Stability AI 高保真文本轉語音模型

Stability AI Text To Speech Models

簡介 :

Stability AI 高保真文本轉語音模型旨在提供對大規模數據集進行訓練的語音合成模型的自然語言引導。它通過標註不同的說話者身份、風格和錄音條件來進行自然語言引導。然後將此方法應用於45000小時的數據集，用於訓練語音語言模型。此外，該模型提出了提高音頻保真度的簡單方法，儘管完全依賴於發現的數據，但在很大程度上表現出色。

需求人群 :

適用於需要控制語音合成模型的說話者身份、風格和錄音條件的用戶。

總訪問量： 0

本站瀏覽量： 85.8K

使用場景

用戶A想要生成一個具有美國口音的女性聲音進行播報

用戶B需要一個帶有英國口音的男性聲音進行錄音

用戶C想要一個帶有南非口音的男性聲音進行播報

產品特色

通過自然語言指導實現高保真文本轉語音

標註不同的說話者身份、風格和錄音條件

提供45000小時的數據集進行訓練