

Audio2photoreal
簡介 :
audio2photoreal是一個從音頻生成照片級逼真avatar的開源項目。它包含了一個pytorch實現,可以從音頻中合成交談中的人類形象。該項目提供了訓練代碼、測試代碼、預訓練的運動模型以及數據集訪問。它的模型包括人臉擴散模型、人體擴散模型、人體VQ VAE模型和人體引導變換器模型。該項目讓研究人員和開發者能夠訓練自己的模型,並基於語音合成高質量的逼真avatar。
需求人群 :
["語音人物形象合成","3D avatar生成","語音驅動的CG角色","元宇宙虛擬形象"]
使用場景
使用自己收集的語音數據訓練模型,生成自定義角色的avatar
利用歷史人物的語音資料,合成逼真的虛擬形象
將角色配音適配到3D遊戲和虛擬空間中
產品特色
從音頻生成逼真的人類avatar
提供預訓練模型和數據集
包含人臉和身體模型
實現高質量avatar渲染
開源pytorch代碼實現
精選AI產品推薦
中文精選

剪映dreamina
剪映Dreamina是抖音旗下的AIGC工具,用戶可以根據文本內容生成由AI生成的創意圖,支持修整圖片大小比例和模板類型。未來會用於抖音的圖文或短視頻的內容創作,豐富抖音在AI創造方面的內容庫。
AI圖像生成
9.1M

Outfit Anyone
Outfit Anyone 是一款超高質量虛擬試穿產品,使用戶能夠在不真實試穿衣物的情況下嘗試不同的時尚款式。通過採用兩個流的條件擴散模型,Outfit Anyone 能夠靈活處理衣物變形,生成更逼真的效果。它具備可擴展性,可以調整姿勢和身體形狀等因素,適用於動漫角色到真實人物的圖像。Outfit Anyone 在各種場景下的表現突出了其實用性和準備好投入實際應用的程度。
AI圖像生成
5.7M