Generative Powers Of Ten : 基於文本描述實現多尺度連續縮放視頻生成。

Generative Powers Of Ten

AI圖像生成 AI圖像增強 #生成模型 #多尺度 #視頻處理 #圖像生成普通產品開源

簡介 :

Generative Powers of Ten是一種利用文本到圖像模型生成多尺度一致內容的方法，能夠實現對場景的極端語義縮放，例如從森林的廣角景觀視圖到樹枝上昆蟲的微距拍攝。這種表示方式使我們能夠渲染連續縮放視頻，或者交互式地探索場景的不同尺度。我們通過一種聯合多尺度擴散採樣方法實現這一點，該方法鼓勵在不同尺度之間保持一致性，同時保留每個單獨採樣過程的完整性。由於每個生成的尺度都由不同的文本提示指導，我們的方法能夠實現比傳統的超分辨率方法更深層次的縮放，後者可能難以在完全不同的尺度上創建新的上下文結構。我們在圖像超分辨率和外部繪製的替代技術上對我們的方法進行了定性比較，並表明我們的方法在生成一致的多尺度內容方面最為有效。

需求人群 :

用戶可以使用Generative Powers of Ten來實現多尺度連續縮放視頻的生成，或者根據輸入圖像進行引導縮放。

總訪問量： 408

佔比最多地區： US(57.62%)

本站瀏覽量： 51.6K

使用場景

使用Generative Powers of Ten生成森林景觀到昆蟲微距的連續縮放視頻

使用Generative Powers of Ten實現對真實圖像的無縫縮放

利用Generative Powers of Ten進行多尺度場景的交互式探索

產品特色

基於文本描述實現多尺度連續縮放視頻生成

可引導縮放級別以匹配輸入圖像