

4D Fy
簡介 :
4D-fy是一種文本到4D生成方法,通過混合分數蒸餾採樣技術,結合了多種預訓練擴散模型的監督信號,實現了高保真的文本到4D場景生成。其方法通過神經表示參數化4D輻射場,使用靜態和動態多尺度哈希表特徵,並利用體積渲染從表示中渲染圖像和視頻。通過混合分數蒸餾採樣,首先使用3D感知文本到圖像模型(3D-T2I)的梯度來優化表示,然後結合文本到圖像模型(T2I)的梯度來改善外觀,最後結合文本到視頻模型(T2V)的梯度來增加場景的運動。4D-fy可以生成具有引人入勝外觀、3D結構和運動的4D場景。
需求人群 :
用於生成文本描述的高保真4D場景,可用於影視特效、虛擬現實等領域
使用場景
電影特效公司使用4D-fy生成火災場景
虛擬現實遊戲開發者使用4D-fy生成動態的虛擬場景
廣告公司使用4D-fy生成具有吸引力外觀和運動效果的產品展示
產品特色
使用混合分數蒸餾採樣技術實現高保真的文本到4D生成
參數化4D輻射場,使用靜態和動態多尺度哈希表特徵
渲染圖像和視頻,結合多種預訓練擴散模型的監督信號
精選AI產品推薦

Sora
Sora是一個基於大規模訓練的文本控制視頻生成擴散模型。它能夠生成長達1分鐘的高清視頻,涵蓋廣泛的視覺數據類型和分辨率。Sora通過在視頻和圖像的壓縮潛在空間中訓練,將其分解為時空位置補丁,實現了可擴展的視頻生成。Sora還展現出一些模擬物理世界和數字世界的能力,如三維一致性和交互,揭示了繼續擴大視頻生成模型規模來發展高能力模擬器的前景。
AI視頻生成
17.2M

Animate Anyone
Animate Anyone旨在通過驅動信號從靜態圖像生成角色視頻。我們利用擴散模型的力量,提出了一個專為角色動畫量身定製的新框架。為了保持參考圖像中複雜外觀特徵的一致性,我們設計了ReferenceNet來通過空間注意力合併詳細特徵。為了確保可控性和連續性,我們引入了一個高效的姿勢指導器來指導角色的動作,並採用了一種有效的時間建模方法,以確保視頻幀之間的平滑跨幀過渡。通過擴展訓練數據,我們的方法可以為任意角色製作動畫,與其他圖像到視頻方法相比,在角色動畫方面取得了出色的結果。此外,我們在時尚視頻和人類舞蹈合成的基準上評估了我們的方法,取得了最先進的結果。
AI視頻生成
11.8M