Audio2photoreal : 從音頻生成照片般逼真的人類avatar

Audio2photoreal

AI頭像生成 AI圖像生成 #AI #語音合成 #圖像生成 #avatar #虛擬人物普通產品開源

簡介 :

audio2photoreal是一個從音頻生成照片級逼真avatar的開源項目。它包含了一個pytorch實現,可以從音頻中合成交談中的人類形象。該項目提供了訓練代碼、測試代碼、預訓練的運動模型以及數據集訪問。它的模型包括人臉擴散模型、人體擴散模型、人體VQ VAE模型和人體引導變換器模型。該項目讓研究人員和開發者能夠訓練自己的模型,並基於語音合成高質量的逼真avatar。

需求人群 :

["語音人物形象合成","3D avatar生成","語音驅動的CG角色","元宇宙虛擬形象"]

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 140.8K

使用場景

使用自己收集的語音數據訓練模型,生成自定義角色的avatar

利用歷史人物的語音資料,合成逼真的虛擬形象

將角色配音適配到3D遊戲和虛擬空間中

產品特色

從音頻生成逼真的人類avatar

提供預訓練模型和數據集