Generative Powers of Ten
G
Generative Powers Of Ten
簡介 :
Generative Powers of Ten是一種利用文本到圖像模型生成多尺度一致內容的方法,能夠實現對場景的極端語義縮放,例如從森林的廣角景觀視圖到樹枝上昆蟲的微距拍攝。這種表示方式使我們能夠渲染連續縮放視頻,或者交互式地探索場景的不同尺度。我們通過一種聯合多尺度擴散採樣方法實現這一點,該方法鼓勵在不同尺度之間保持一致性,同時保留每個單獨採樣過程的完整性。由於每個生成的尺度都由不同的文本提示指導,我們的方法能夠實現比傳統的超分辨率方法更深層次的縮放,後者可能難以在完全不同的尺度上創建新的上下文結構。我們在圖像超分辨率和外部繪製的替代技術上對我們的方法進行了定性比較,並表明我們的方法在生成一致的多尺度內容方面最為有效。
需求人群 :
用戶可以使用Generative Powers of Ten來實現多尺度連續縮放視頻的生成,或者根據輸入圖像進行引導縮放。
總訪問量: 408
佔比最多地區: US(57.62%)
本站瀏覽量 : 51.6K
使用場景
使用Generative Powers of Ten生成森林景觀到昆蟲微距的連續縮放視頻
使用Generative Powers of Ten實現對真實圖像的無縫縮放
利用Generative Powers of Ten進行多尺度場景的交互式探索
產品特色
基於文本描述實現多尺度連續縮放視頻生成
可引導縮放級別以匹配輸入圖像
通過變化種子可以獲得相同輸入提示的不同結果
與穩定擴散的超分辨率和外部繪製模型進行基準比較
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase