Videoretalking : 音頻驅動的視頻編輯，實現高質量唇形同步

Videoretalking

AI視頻編輯 AI視頻生成 #音頻驅動 #唇形同步 #面部增強 #表情編輯 #視頻編輯普通產品開源

簡介 :

VideoReTalking是一個新的系統，可以根據輸入的音頻編輯真實世界的說話頭部視頻的面部，產生高質量的唇形同步輸出視頻，即使情感不同。該系統將此目標分解為三個連續的任務：（1）使用表情編輯網絡生成帶有規範表情的面部視頻；（2）音頻驅動的唇形同步；（3）用於提高照片逼真度的面部增強。給定一個說話頭部視頻，我們首先使用表情編輯網絡根據相同的表情模板修改每個幀的表情，從而得到具有規範表情的視頻。然後將該視頻與給定的音頻一起輸入到唇形同步網絡中，生成唇形同步視頻。最後，我們通過一個身份感知的面部增強網絡和後處理來提高合成面部的照片逼真度。我們對所有三個步驟使用基於學習的方法，所有模塊都可以在順序管道中處理，無需任何用戶干預。

需求人群 :

適用於需要音頻驅動的唇形同步的視頻編輯場景，可以用於電影、電視劇、廣告等領域。

總訪問量： 0

本站瀏覽量： 333.1K

使用場景

電影製作人使用VideoReTalking來編輯電影中的角色對白，實現高質量唇形同步。

廣告公司使用VideoReTalking來製作廣告，使演員的口型與音頻完美匹配。

電視劇製作人使用VideoReTalking來編輯電視劇中的角色對白，實現高質量唇形同步。

產品特色

音頻驅動的唇形同步

面部增強

表情編輯