マスキング拡散トランスフォーマー (MDT)
マ
マスキング拡散トランスフォーマー (MDT)
紹介 :
MDTは、マスクされた潜在モデルスキームを導入することで、拡散確率モデル(DPMs)が画像内におけるオブジェクト部分間の関係学習能力を明示的に強化します。MDTは訓練中に潜在空間で動作し、特定のトークンをマスクした後、非マスクトークンからマスクトークンを予測する非対称拡散トランスフォーマーを設計します。これは、拡散生成プロセスを維持しながら行われます。MDTv2は、より効率的なマクロネットワーク構造と訓練戦略によって、MDTの性能をさらに向上させています。
ターゲットユーザー :
高品質な画像合成を必要とする研究者や開発者、特に画像生成と深層学習の分野に従事する方々に適しています。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 56.6K
使用シナリオ
MDTを用いた高解像度画像の生成
画像合成タスクにおける高速学習の実現
MDTv2を用いた画像合成のFIDスコアの向上
製品特徴
画像合成
マスク潜在モデルスキーム
非対称拡散トランスフォーマー
効率的なマクロネットワーク構造と訓練戦略
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase