Audio2photoreal : 音声から写真のようにリアルな人間のアバターを生成します

Audio2photoreal

AI顔画像生成 AI画像生成 #AI #音声合成 #画像生成 #アバター #バーチャルキャラクター通常製品オープンソース

紹介 :

audio2photorealは、音声から写真レベルでリアルなアバターを生成するオープンソースプロジェクトです。PyTorchによる実装を含み、音声から会話中の人の姿を合成できます。本プロジェクトでは、トレーニングコード、テストコード、事前学習済みのモーションモデル、そしてデータセットへのアクセスを提供します。モデルには、顔拡散モデル、人体拡散モデル、人体VQ VAEモデル、人体誘導変換器モデルが含まれます。研究者や開発者は、独自のモデルをトレーニングし、音声に基づいて高品質でリアルなアバターを合成することができます。

ターゲットユーザー :

["音声によるキャラクターイメージ合成","3Dアバター生成","音声駆動型CGキャラクター","メタバース仮想イメージ"]

総訪問数： 502.6M

最も高い割合の地域： US(19.34%)

ウェブサイト閲覧数： 138.8K

使用シナリオ

自分で収集した音声データを使用してモデルをトレーニングし、カスタムキャラクターのアバターを生成する

歴史上の人物の音声資料を利用して、リアルなバーチャルイメージを合成する

3Dゲームや仮想空間へのキャラクターボイスを適合させる

製品特徴

音声からリアルな人間のエイターを生成する

事前学習済みモデルとデータセットを提供する