Masked Diffusion Transformer (MDT)
M
Masked Diffusion Transformer (MDT)
简介 :
MDT通过引入掩码潜在模型方案来显式增强扩散概率模型(DPMs)在图像中对象部分之间关系学习的能力。MDT在训练期间在潜在空间中操作,掩蔽某些标记,然后设计一个不对称的扩散变换器来从未掩蔽的标记中预测掩蔽的标记,同时保持扩散生成过程。MDTv2进一步通过更有效的宏网络结构和训练策略提高了MDT的性能。
需求人群 :
适用于需要高质量图像合成的研究者和开发者,尤其是在图像生成和深度学习领域。
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 61.0K
使用场景
使用MDT进行高分辨率图像的生成
在图像合成任务中实现快速学习
利用MDTv2提高图像合成的FID分数
产品特色
图像合成
掩码潜在模型方案
不对称扩散变换器
高效宏网络结构和训练策略
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase