Pandrator : オープンソースのGUIオーディオブックおよび音声生成器です。

すべてのカテゴリ

Pandrator

Pandrator

Pandrator

AI音声合成 AI文章翻訳音声 #テキスト読み上げ #音声クローン #オーディオ編集 #GUI #オープンソース通常製品オープンソース

紹介 :

Pandratorはオープンソースソフトウェアをベースとしたツールで、テキスト、PDF、EPUB、SRTファイルを、音声クローン、LLMベースのテキスト前処理、生成された字幕音声のビデオファイルへの直接保存と元の音声トラックとの混合を含む、複数の言語の音声オーディオに変換できます。ワンクリックインストーラーとグラフィカルユーザーインターフェースを備え、使いやすく、インストールも容易です。

ターゲットユーザー :

Pandratorは、特にオーディオブックの作成やビデオへの吹き替えを希望するユーザー、テキストを音声に変換する必要があるユーザーに適しています。オープンソースの特性を利用してカスタマイズや拡張を行うことができるため、技術愛好家や開発者にも特に適しています。

総訪問数： 502.6M

最も高い割合の地域： US(19.34%)

ウェブサイト閲覧数： 70.4K

使用シナリオ

Pandratorを使用して小説をオーディオブックに変換する。

ビデオプロジェクトに多言語吹き替えを追加する。

音声クローン技術を利用して、特定の人物の声の音声を生成する。

製品特徴

テキスト前処理：テキストをセンテンスに分割し、パラグラフを保持します。

LLMテキスト前処理：ローカルLLMを使用してテキストの修正と強化を行います。

音声生成：処理済みのテキストを音声に変換します。音声クローンと品質向上に対応しています。

音声評価：生成されたセンテンスの平均意見スコア（MOS）を予測します。

ビデオファイルへの吹き替えの生成と追加：字幕ファイルの音声をSRTタイムスタンプと同期します。

セッション管理：ワークフローを整理するために、セッションの作成、削除、読み込みをサポートします。

グラフィカルユーザーインターフェース：customtkinterを使用して構築され、ユーザーフレンドリーなエクスペリエンスを提供します。

使用チュートリアル

Pandratorをダウンロードしてインストールします。

Pandratorを実行し、入力としてテキストまたはファイルを選択します。

必要な音声と言語設定を選択します。

必要に応じて、テキスト前処理とLLMテキスト前処理を行います。

音声の生成を開始し、必要に応じて設定を調整します。

GUIを使用して、生成されたセンテンスの再生、編集、削除を行います。

出力音声ファイルを保存するか、ビデオファイルに追加します。

おすすめAI製品

GPT-SoVITS

GPT-SoVITS-WebUIは、強力なゼロショット音声変換とテキスト音声変換WebUIです。ゼロショットTTS、少サンプルTTS、クロスリンガルサポート、WebUIツールなどの機能を備えています。英語、日本語、中国語に対応しており、音声伴奏分離、自動トレーニングセット分割、中国語ASR、テキストアノテーションなどの統合ツールを提供し、初心者によるトレーニングデータセットとGPT/SoVITSモデルの作成を支援します。5秒の音声サンプルを入力するだけで、即時のテキスト音声変換を体験できます。また、わずか1分のトレーニングデータでモデルを微調整し、音声の類似度とリアルさを向上させることも可能です。環境準備、PythonとPyTorchのバージョン、クイックインストール、手動インストール、学習済みモデル、データセットフォーマット、TODO、謝辞などをサポートしています。

Clone-Voice

Clone-VoiceはWebインターフェースを備えた音声クローンツールです。あらゆる人間のトーンを使用して、テキストをそのトーンで話す音声に合成したり、ある音声のトーンを別のトーンに変換したりできます。中国語、英語、日本語、韓国語、フランス語、ドイツ語、イタリア語など16言語に対応しており、オンラインでマイクから音声を録音できます。テキスト読み上げと音声変換機能を搭載。NカードGPUが不要で、シンプルで使いやすい点が強みです。多言語対応で、音声録音も柔軟に行えます。現在、無料で利用できます。

AIbase

未来を切り開く、あなたのAIソリューション知識ベース

English 简体中文繁體中文にほんご

© 2025AIbase