seed-tts-eval
S
Seed Tts Eval
簡介 :
seed-tts-eval 是一個用於評估模型零樣本語音生成能力的測試集,它提供了一個跨領域目標的客觀評估測試集,包含從英語和普通話公共語料庫中提取的樣本,用於衡量模型在各種客觀指標上的表現。它使用了Common Voice數據集的1000個樣本和DiDiSpeech-2數據集的2000個樣本。
需求人群 :
目標受眾為語音合成技術的研究者和開發者,他們可以利用seed-tts-eval模型來評估和改進他們的語音合成系統。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 129.4K
使用場景
研究者使用seed-tts-eval評估新的語音合成模型的性能
開發者利用該測試集比較不同語音合成技術的效果
教育機構使用該測試集作為教學材料,教授語音合成技術
產品特色
採用Common Voice和DiDiSpeech-2數據集樣本進行評估
使用Word Error Rate (WER)和Speaker Similarity (SIM)作為評估指標
為英語和普通話分別採用Whisper-large-v3和Paraformer-zh作為自動語音識別引擎
使用WavLM-large模型進行說話人相似度評估
提供測試集的下載鏈接
支持零樣本文本到語音(TTS)和聲音轉換(VC)任務的評估
使用教程
訪問seed-tts-eval的GitHub頁面
閱讀README文件瞭解如何安裝依賴和使用測試集
下載所需的測試集樣本
使用提供的評估代碼進行模型性能的評估
根據評估結果優化語音合成模型
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase