audio2photoreal
A
Audio2photoreal
紹介 :
audio2photorealは、音声から写真レベルでリアルなアバターを生成するオープンソースプロジェクトです。PyTorchによる実装を含み、音声から会話中の人の姿を合成できます。本プロジェクトでは、トレーニングコード、テストコード、事前学習済みのモーションモデル、そしてデータセットへのアクセスを提供します。モデルには、顔拡散モデル、人体拡散モデル、人体VQ VAEモデル、人体誘導変換器モデルが含まれます。研究者や開発者は、独自のモデルをトレーニングし、音声に基づいて高品質でリアルなアバターを合成することができます。
ターゲットユーザー :
["音声によるキャラクターイメージ合成","3Dアバター生成","音声駆動型CGキャラクター","メタバース仮想イメージ"]
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 138.8K
使用シナリオ
自分で収集した音声データを使用してモデルをトレーニングし、カスタムキャラクターのアバターを生成する
歴史上の人物の音声資料を利用して、リアルなバーチャルイメージを合成する
3Dゲームや仮想空間へのキャラクターボイスを適合させる
製品特徴
音声からリアルな人間のエイターを生成する
事前学習済みモデルとデータセットを提供する
顔と体のモデルを含む
高品質なアバターレンダリングを実現する
オープンソースのPyTorchコード実装
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase