
使用場景
使用Pandrator將小說轉換成有聲書。
為視頻項目添加多語言配音。
利用語音克隆技術生成特定人聲的音頻。
產品特色
文本預處理:將文本分割成句子,保留段落。
LLM文本預處理:使用本地LLM進行文本校正和增強。
音頻生成:將處理後的文本轉換為語音,支持語音克隆和質量增強。
音頻評估:預測生成句子的平均意見分數(MOS)。
生成並添加配音到視頻文件:將字幕文件中的語音與SRT時間戳同步。
會話管理:支持創建、刪除和加載會話,以組織工作流程。
圖形用戶界面:使用customtkinter構建,提供友好的用戶體驗。
使用教程
下載並安裝Pandrator。
運行Pandrator並選擇文本或文件作為輸入。
選擇所需的語音和語言設置。
進行文本預處理和LLM文本預處理(如果需要)。
開始生成音頻並根據需要調整設置。
使用GUI播放、編輯或刪除生成的句子。
保存輸出的音頻文件或將其添加到視頻文件中。
精選AI產品推薦

GPT SoVITS
GPT-SoVITS-WebUI是一個強大的零樣本語音轉換和文本到語音WebUI。它具有零樣本TTS、少樣本TTS、跨語言支持和WebUI工具等功能。該產品支持英語、日語和中文,提供了集成工具,包括語音伴奏分離、自動訓練集分割、中文ASR和文本標註,幫助初學者創建訓練數據集和GPT/SoVITS模型。用戶可以通過輸入5秒的聲音樣本,即可體驗即時的文本到語音轉換,還可以通過僅使用1分鐘的訓練數據對模型進行微調,以提高語音相似度和逼真度。產品支持環境準備、Python和PyTorch版本、快速安裝、手動安裝、預訓練模型、數據集格式、待辦事項和致謝。
AI語音合成
6.9M

Clone Voice
Clone-Voice是一個帶 web 界面的聲音克隆工具,可使用任何人類音色,將一段文字合成為使用該音色說話的聲音,或者將一個聲音使用該音色轉換為另一個聲音。支持中、英、日、韓、法、德、意等 16 種語言,可在線從麥克風錄製聲音。功能包括文字到語音和聲音到聲音轉換。優勢在於簡單易用且無需 N 卡 GPU,支持多種語言,錄製聲音靈活。產品目前免費使用。
AI語音合成
4.2M