

Voicecraft
紹介 :
VoiceCraftは、トークン埋め込みに基づくニューラルコーデック言語モデルであり、最先端の音声編集とゼロショットテキスト音声変換(TTS)性能を実現します。未知の音声についても、数秒間の音声サンプルがあれば、その音声をクローンしたり、録音を編集することができます。このモデルは、オーディオブック、オンラインビデオ、ポッドキャストなどの実世界データに適しています。
ターゲットユーザー :
オーディオブック、オンラインビデオ、ポッドキャストなどの音声コンテンツの作成と編集に使用します。
使用シナリオ
VoiceCraftを使用して自然な音声を作成し、オーディオブックやポッドキャスト番組を制作する。
既存の録音を編集し、内容を変更したり、話者の声を変更する。
少量の音声サンプルから特定の人物の声をクローンし、カスタマイズされた音声コンテンツを作成する。
製品特徴
音声編集
ゼロショットテキスト音声変換
未知の音声のクローン作成
録音の編集
おすすめAI製品

GPT SoVITS
GPT-SoVITS-WebUIは、強力なゼロショット音声変換とテキスト音声変換WebUIです。ゼロショットTTS、少サンプルTTS、クロスリンガルサポート、WebUIツールなどの機能を備えています。英語、日本語、中国語に対応しており、音声伴奏分離、自動トレーニングセット分割、中国語ASR、テキストアノテーションなどの統合ツールを提供し、初心者によるトレーニングデータセットとGPT/SoVITSモデルの作成を支援します。5秒の音声サンプルを入力するだけで、即時のテキスト音声変換を体験できます。また、わずか1分のトレーニングデータでモデルを微調整し、音声の類似度とリアルさを向上させることも可能です。環境準備、PythonとPyTorchのバージョン、クイックインストール、手動インストール、学習済みモデル、データセットフォーマット、TODO、謝辞などをサポートしています。
AI音声合成
5.7M

Clone Voice
Clone-VoiceはWebインターフェースを備えた音声クローンツールです。あらゆる人間のトーンを使用して、テキストをそのトーンで話す音声に合成したり、ある音声のトーンを別のトーンに変換したりできます。中国語、英語、日本語、韓国語、フランス語、ドイツ語、イタリア語など16言語に対応しており、オンラインでマイクから音声を録音できます。テキスト読み上げと音声変換機能を搭載。NカードGPUが不要で、シンプルで使いやすい点が強みです。多言語対応で、音声録音も柔軟に行えます。現在、無料で利用できます。
AI音声合成
3.6M