マスキング拡散トランスフォーマー (MDT) : マスキング拡散トランスフォーマー (MDT) は画像合成における最新の技術であり、ICCV 2023において最先端 (SOTA) の成果を達成しました。

マスキング拡散トランスフォーマー (MDT)

AI画像生成 AIモデル #画像 #画像合成 #深層学習 #マスクトランスフォーマー #SOTA 通常製品オープンソース

紹介 :

MDTは、マスクされた潜在モデルスキームを導入することで、拡散確率モデル（DPMs）が画像内におけるオブジェクト部分間の関係学習能力を明示的に強化します。MDTは訓練中に潜在空間で動作し、特定のトークンをマスクした後、非マスクトークンからマスクトークンを予測する非対称拡散トランスフォーマーを設計します。これは、拡散生成プロセスを維持しながら行われます。MDTv2は、より効率的なマクロネットワーク構造と訓練戦略によって、MDTの性能をさらに向上させています。

ターゲットユーザー :

高品質な画像合成を必要とする研究者や開発者、特に画像生成と深層学習の分野に従事する方々に適しています。

総訪問数： 502.6M

最も高い割合の地域： US(19.34%)

ウェブサイト閲覧数： 56.6K

使用シナリオ

MDTを用いた高解像度画像の生成

画像合成タスクにおける高速学習の実現

MDTv2を用いた画像合成のFIDスコアの向上

製品特徴

画像合成

マスク潜在モデルスキーム