Seed Tts Eval : 用於評估模型零樣本語音生成能力的測試集

Seed Tts Eval

簡介 :

seed-tts-eval 是一個用於評估模型零樣本語音生成能力的測試集，它提供了一個跨領域目標的客觀評估測試集，包含從英語和普通話公共語料庫中提取的樣本，用於衡量模型在各種客觀指標上的表現。它使用了Common Voice數據集的1000個樣本和DiDiSpeech-2數據集的2000個樣本。

需求人群 :

目標受眾為語音合成技術的研究者和開發者，他們可以利用seed-tts-eval模型來評估和改進他們的語音合成系統。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 129.4K

使用場景

研究者使用seed-tts-eval評估新的語音合成模型的性能

開發者利用該測試集比較不同語音合成技術的效果

教育機構使用該測試集作為教學材料，教授語音合成技術

產品特色

採用Common Voice和DiDiSpeech-2數據集樣本進行評估

使用Word Error Rate (WER)和Speaker Similarity (SIM)作為評估指標

為英語和普通話分別採用Whisper-large-v3和Paraformer-zh作為自動語音識別引擎

使用WavLM-large模型進行說話人相似度評估

提供測試集的下載鏈接

支持零樣本文本到語音(TTS)和聲音轉換(VC)任務的評估

使用教程

訪問seed-tts-eval的GitHub頁面

閱讀README文件瞭解如何安裝依賴和使用測試集

下載所需的測試集樣本

使用提供的評估代碼進行模型性能的評估

根據評估結果優化語音合成模型

精選AI產品推薦

智啟未來，您的人工智能解決方案智庫

直接訪問	51.61%	外鏈引薦	33.46%	郵件	0.04%
自然搜索	12.58%	社交媒體	2.19%	展示廣告	0.11%