

マスキング拡散トランスフォーマー (MDT)
紹介 :
MDTは、マスクされた潜在モデルスキームを導入することで、拡散確率モデル(DPMs)が画像内におけるオブジェクト部分間の関係学習能力を明示的に強化します。MDTは訓練中に潜在空間で動作し、特定のトークンをマスクした後、非マスクトークンからマスクトークンを予測する非対称拡散トランスフォーマーを設計します。これは、拡散生成プロセスを維持しながら行われます。MDTv2は、より効率的なマクロネットワーク構造と訓練戦略によって、MDTの性能をさらに向上させています。
ターゲットユーザー :
高品質な画像合成を必要とする研究者や開発者、特に画像生成と深層学習の分野に従事する方々に適しています。
使用シナリオ
MDTを用いた高解像度画像の生成
画像合成タスクにおける高速学習の実現
MDTv2を用いた画像合成のFIDスコアの向上
製品特徴
画像合成
マスク潜在モデルスキーム
非対称拡散トランスフォーマー
効率的なマクロネットワーク構造と訓練戦略
おすすめAI製品

Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選

剪映dreamina
剪映DreaminaはTikTok(抖音)が提供するAIGCツールです。テキストを入力すると、AIが自動的にクリエイティブな画像を生成します。画像サイズやアスペクト比、テンプレートの種類も調整可能です。将来的には、TikTokの画像投稿やショート動画のコンテンツ制作にも活用され、TikTokのAIによるコンテンツ制作の充実を図ります。
AI画像生成
9.0M