

Stable Video Portraits
簡介 :
Stable Video Portraits是一種創新的混合2D/3D生成方法,利用預訓練的文本到圖像模型(2D)和3D形態模型(3D)生成逼真的動態人臉視頻。該技術通過人特定的微調,將一般2D穩定擴散模型提升到視頻模型,通過提供時間序列的3D形態模型作為條件,並引入時間去噪過程,生成具有時間平滑性的人臉影像,可以編輯和變形為文本定義的名人形象,無需額外的測試時微調。該方法在定量和定性分析中均優於現有的單目頭部化身方法。
需求人群 :
目標受眾包括但不限於:計算機視覺研究人員、人工智能開發者、數字媒體藝術家、電影和遊戲製作人員。Stable Video Portraits技術因其逼真的動態人臉生成能力,特別適合需要創建虛擬角色或進行面部動畫的專業人士。
使用場景
電影製作中,用於生成逼真的虛擬角色。
遊戲開發中,用於創建具有高度真實感的NPC面部動畫。
數字藝術領域,藝術家利用該技術創作獨特的藝術作品。
產品特色
使用現成的3D面部重建方法、面部解析映射(FPM)模型和Mediapipe處理輸入視頻,提取每幀的3D面部重建(3DMM)、FPM和虹膜位置。
並行訓練兩個ControlNets,分別生成時間穩定的輪廓(第一階段)和內部細節(第二階段),生成逼真的個人化身。
個人化身可以通過文本進一步變形為名人,無需額外微調。
使用前一幀的預測,修改DDIM步驟t=τ的推理,以考慮前一幀,從而實現時間平滑輸出。
面部變形功能,可以將個人化身變形為特定名人,如Scarlet Johansson或Emma Watson,並保持頭部姿態一致性。
與當前單目頭部化身方法的比較,展示其優越性。
通過消融研究,分析變形因子、輸入控制和去噪過程變量對結果的影響。
使用教程
1. 訪問Stable Video Portraits的官方網站。
2. 閱讀有關該技術的研究論文和方法概述。
3. 下載並安裝所需的軟件和庫。
4. 準備輸入視頻,確保視頻質量滿足3D面部重建的要求。
5. 使用3D面部重建方法、FPM模型和Mediapipe提取視頻中的3DMM、FPM和虹膜位置。
6. 訓練ControlNets以生成輪廓和內部細節。
7. 利用時間去噪過程生成時間平滑的視頻輸出。
8. 如有需要,通過文本輸入調整個人化身的面部特徵,以匹配特定名人的形象。
精選AI產品推薦

Sora
Sora是一個基於大規模訓練的文本控制視頻生成擴散模型。它能夠生成長達1分鐘的高清視頻,涵蓋廣泛的視覺數據類型和分辨率。Sora通過在視頻和圖像的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴展的視頻生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和交互,揭示了繼續擴大視頻生成模型規模來發展高能力模擬器的前景。
AI視頻生成
17.2M

Animate Anyone
Animate Anyone旨在通過驅動信號從靜態圖像生成角色視頻。我們利用擴散模型的力量,提出了一個專為角色動畫量身定製的新框架。為了保持參考圖像中複雜外觀特徵的一致性,我們設計了ReferenceNet來通過空間注意力合併詳細特徵。為了確保可控性和連續性,我們引入了一個高效的姿勢指導器來指導角色的動作,並採用了一種有效的時間建模方法,以確保視頻幀之間的平滑跨幀過渡。通過擴展訓練數據,我們的方法可以為任意角色製作動畫,與其他圖像到視頻方法相比,在角色動畫方面取得了出色的結果。此外,我們在時尚視頻和人類舞蹈合成的基準上評估了我們的方法,取得了最先進的結果。
AI視頻生成
11.8M