Masked Diffusion Transformer (MDT)
M
Masked Diffusion Transformer (MDT)
簡介 :
MDT通過引入掩碼潛在模型方案來顯式增強擴散概率模型(DPMs)在圖像中對象部分之間關係學習的能力。MDT在訓練期間在潛在空間中操作,掩蔽某些標記,然後設計一個不對稱的擴散變換器來從未掩蔽的標記中預測掩蔽的標記,同時保持擴散生成過程。MDTv2進一步通過更有效的宏網絡結構和訓練策略提高了MDT的性能。
需求人群 :
適用於需要高質量圖像合成的研究者和開發者,尤其是在圖像生成和深度學習領域。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 58.2K
使用場景
使用MDT進行高分辨率圖像的生成
在圖像合成任務中實現快速學習
利用MDTv2提高圖像合成的FID分數
產品特色
圖像合成
掩碼潛在模型方案
不對稱擴散變換器
高效宏網絡結構和訓練策略
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase