ActAnywhere
A
Actanywhere
紹介 :
ActAnywhereは、前景の主体動作や外観と一致するビデオ背景を自動生成するモデルです。このタスクは、前景の主体動作や外観と一致するだけでなく、アーティストの意図にも沿った背景を合成することを含みます。ActAnywhereは大規模ビデオ拡散モデルを活用し、このタスク向けに特化して開発されました。ActAnywhereは、前景の主体セグメンテーションのシーケンスを入力として、必要なシーンを記述する画像を条件として、条件フレームと整合性のある連続ビデオを生成し、現実的な前景と背景の相互作用を実現します。このモデルは大規模な人とコンピューターのインタラクションビデオデータセットでトレーニングされています。多くの評価により、このモデルは基準モデルよりも明らかに優れた性能を示し、人間以外の主体を含む様々な分布サンプルに対して汎化できることが示されています。
ターゲットユーザー :
ActAnywhereは、人物やその他の主体を含むビデオに対して、対応する背景を自動的に生成することで、手作業による調整の労力を削減し、ビデオ制作効率を向上させるために使用できます。
総訪問数: 0
ウェブサイト閲覧数 : 166.7K
使用シナリオ
人物の動きを含むビデオセグメンテーションシーケンスと海辺の写真を使用して、海辺を走る人物の合成ビデオを生成する
ダンスの動きを含むビデオセグメンテーションと古代の宮殿の写真を使用して、宮殿でダンスを行う効果を生成する
車が走行するビデオセグメンテーションと高層ビルの写真を使用して、街中を車が走行する効果を生成する
製品特徴
入力された前景の主体セグメンテーションシーケンスに基づき、条件画像に一致するビデオ背景を生成する
生成された背景は、前景の主体動作や外観と調和する
主体を含む合成フレーム、または背景のみのフレームを条件画像として使用可能
様々なカメラモーションを持つビデオ背景を生成可能
おすすめAI製品
Sora
Sora
Soraは、大規模データで学習されたテキスト制御型ビデオ生成拡散モデルです。1分間の高解像度ビデオ生成が可能で、幅広い視覚データの種類と解像度に対応します。ビデオと画像の圧縮潜在空間で学習することで、時空間的位置パッチに分解し、スケーラブルなビデオ生成を実現しています。また、三次元の一貫性やインタラクションなど、物理世界とデジタル世界の挙動をある程度シミュレートできる能力を示しており、高性能シミュレータの開発に向けて、ビデオ生成モデルの大規模化が有望であることを示唆しています。
AI動画生成
17.0M
Animate Anyone
Animate Anyone
Animate Anyoneは、駆動信号から静止画像を基にキャラクタビデオを生成することを目指しています。拡散モデルの力を活用し、キャラクタアニメーション用に特化した新しいフレームワークを提案します。参照画像における複雑な外観特徴の一貫性を維持するため、空間的注意機構を用いて詳細な特徴を統合するReferenceNetを設計しました。制御可能性と連続性を確保するため、キャラクタの動作をガイドする効率的なポーズガイド機構を導入し、ビデオフレーム間の滑らかなクロスフェードを実現する効果的な時間モデリング手法を採用しています。トレーニングデータの拡張により、任意のキャラクタのアニメーション作成が可能になり、他の画像からビデオへの変換手法と比較して、キャラクタアニメーションにおいて優れた結果を得ています。さらに、ファッションビデオと人間のダンス合成のベンチマークにおいて最先端の結果を達成しました。
AI動画生成
11.4M
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase