Actanywhere : ActAnywhereは、主体認識ビデオ背景生成モデルです。

Actanywhere

AI動画生成 AI画像生成 #ビデオ処理 #ビデオ生成 #背景置換 #画像セグメンテーション #物体検出通常製品オープンソース

紹介 :

ActAnywhereは、前景の主体動作や外観と一致するビデオ背景を自動生成するモデルです。このタスクは、前景の主体動作や外観と一致するだけでなく、アーティストの意図にも沿った背景を合成することを含みます。ActAnywhereは大規模ビデオ拡散モデルを活用し、このタスク向けに特化して開発されました。ActAnywhereは、前景の主体セグメンテーションのシーケンスを入力として、必要なシーンを記述する画像を条件として、条件フレームと整合性のある連続ビデオを生成し、現実的な前景と背景の相互作用を実現します。このモデルは大規模な人とコンピューターのインタラクションビデオデータセットでトレーニングされています。多くの評価により、このモデルは基準モデルよりも明らかに優れた性能を示し、人間以外の主体を含む様々な分布サンプルに対して汎化できることが示されています。

ターゲットユーザー :

ActAnywhereは、人物やその他の主体を含むビデオに対して、対応する背景を自動的に生成することで、手作業による調整の労力を削減し、ビデオ制作効率を向上させるために使用できます。

総訪問数： 0

ウェブサイト閲覧数： 166.7K

使用シナリオ

人物の動きを含むビデオセグメンテーションシーケンスと海辺の写真を使用して、海辺を走る人物の合成ビデオを生成する

ダンスの動きを含むビデオセグメンテーションと古代の宮殿の写真を使用して、宮殿でダンスを行う効果を生成する

車が走行するビデオセグメンテーションと高層ビルの写真を使用して、街中を車が走行する効果を生成する

製品特徴

入力された前景の主体セグメンテーションシーケンスに基づき、条件画像に一致するビデオ背景を生成する

生成された背景は、前景の主体動作や外観と調和する

主体を含む合成フレーム、または背景のみのフレームを条件画像として使用可能