audio2photoreal
A
Audio2photoreal
簡介 :
audio2photoreal是一個從音頻生成照片級逼真avatar的開源項目。它包含了一個pytorch實現,可以從音頻中合成交談中的人類形象。該項目提供了訓練代碼、測試代碼、預訓練的運動模型以及數據集訪問。它的模型包括人臉擴散模型、人體擴散模型、人體VQ VAE模型和人體引導變換器模型。該項目讓研究人員和開發者能夠訓練自己的模型,並基於語音合成高質量的逼真avatar。
需求人群 :
["語音人物形象合成","3D avatar生成","語音驅動的CG角色","元宇宙虛擬形象"]
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 140.8K
使用場景
使用自己收集的語音數據訓練模型,生成自定義角色的avatar
利用歷史人物的語音資料,合成逼真的虛擬形象
將角色配音適配到3D遊戲和虛擬空間中
產品特色
從音頻生成逼真的人類avatar
提供預訓練模型和數據集
包含人臉和身體模型
實現高質量avatar渲染
開源pytorch代碼實現
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase