Viewdiff : 基於預訓練的文本到圖像模型生成高質量、多視角一致的3D物體圖像。

Viewdiff

簡介 :

ViewDiff 是一種利用預訓練的文本到圖像模型作為先驗知識,從真實世界數據中學習生成多視角一致的圖像的方法。它在U-Net網絡中加入了3D體積渲染和跨幀注意力層,能夠在單個去噪過程中生成3D一致的圖像。與現有方法相比,ViewDiff生成的結果具有更好的視覺質量和3D一致性。

需求人群 :

3D模型生成、圖像合成、虛擬現實等應用場景

總訪問量： 1.4K

佔比最多地區： DE(93.94%)

本站瀏覽量： 87.2K

使用場景

生成各種形狀和質地的3D物體圖像,並將其置於真實世界環境中

根據文本描述生成一個3D物體的多角度圖像

給定單個圖像,生成該物體在不同視角下的圖像

產品特色

基於預訓練的文本到圖像模型生成3D一致的圖像

在U-Net網絡中加入3D體積渲染和跨幀注意力層

單個去噪過程中生成多視角一致的圖像

精選AI產品推薦

智啟未來，您的人工智能解決方案智庫

直接訪問	65.36%	外鏈引薦	21.59%	郵件	0.11%
自然搜索	8.89%	社交媒體	2.86%	展示廣告	0.85%