

SV4D
紹介 :
Stable Video 4D (SV4D) は、Stable Video Diffusion (SVD) と Stable Video 3D (SV3D) をベースとした生成モデルです。単一視点の動画を入力として受け取り、そのオブジェクトの複数の新しい視点の動画(4D画像マトリックス)を生成します。このモデルは、5つの同じサイズの参照フレームを与えられた場合、576x576ピクセルの解像度で40フレーム(5つの動画フレーム x 8つのカメラ視点)を生成するように学習されています。SV3Dを使用して軌道動画を生成し、その軌道動画をSV4Dの参照ビューとして使用し、入力動画を参照フレームとして使用して4Dサンプリングを行います。また、生成された最初のフレームをアンカーとして使用し、残りのフレームを密集サンプリング(補間)することで、より長い新しい視点の動画を生成します。
ターゲットユーザー :
アーティスト、デザイナー、教育者、研究者など。SV4Dは、アート制作、デザインプレゼンテーション、教育演示などに使用できる、新しい視点の動画を生成するのに役立ちます。
使用シナリオ
アーティストがSV4Dを使用して、彫刻の動画を様々な視点から生成し、芸術展に使用します。
デザイナーがSV4Dを使用して、製品の多視点展示動画を生成し、製品の展示効果を高めます。
教育者がSV4Dを使用して、複雑な科学概念の多視点動画を生成し、生徒の理解を深めます。
製品特徴
576x576ピクセルの解像度で40フレームの4D画像マトリックスを生成します。
SV3Dを使用して軌道動画を生成し、SV4Dの参照ビューとして使用します。
入力動画を参照フレームとして使用し、4Dサンプリングを行います。
残りのフレームを密集サンプリング(補間)することで、より長い新しい視点の動画を生成します。
アート作品やデザインプロセスの生成に適しています。
教育ツールやクリエイティブツールとして活用できます。
生成モデルの研究、特に生成モデルの限界を理解することに役立ちます。
使用チュートリアル
1. 解像度576x576ピクセルの参照フレーム5つを準備します。
2. SV3Dモデルを使用して軌道動画を生成し、SV4Dの参照ビューとして使用します。
3. 軌道動画と入力動画を参照フレームとして、SV4Dモデルに入力します。
4. SV4Dモデルを実行し、4D画像マトリックスを生成します。
5. 必要に応じて、生成された最初のフレームをアンカーとして使用し、密集サンプリング(補間)してより長い新しい視点の動画を生成します。
6. 生成された動画が期待通りの効果かどうかを確認し、必要に応じて調整します。
7. 生成された動画をアート制作、デザインプレゼンテーション、教育演示などに活用します。
おすすめAI製品

Sora
Soraは、大規模データで学習されたテキスト制御型ビデオ生成拡散モデルです。1分間の高解像度ビデオ生成が可能で、幅広い視覚データの種類と解像度に対応します。ビデオと画像の圧縮潜在空間で学習することで、時空間的位置パッチに分解し、スケーラブルなビデオ生成を実現しています。また、三次元の一貫性やインタラクションなど、物理世界とデジタル世界の挙動をある程度シミュレートできる能力を示しており、高性能シミュレータの開発に向けて、ビデオ生成モデルの大規模化が有望であることを示唆しています。
AI動画生成
17.0M

Animate Anyone
Animate Anyoneは、駆動信号から静止画像を基にキャラクタビデオを生成することを目指しています。拡散モデルの力を活用し、キャラクタアニメーション用に特化した新しいフレームワークを提案します。参照画像における複雑な外観特徴の一貫性を維持するため、空間的注意機構を用いて詳細な特徴を統合するReferenceNetを設計しました。制御可能性と連続性を確保するため、キャラクタの動作をガイドする効率的なポーズガイド機構を導入し、ビデオフレーム間の滑らかなクロスフェードを実現する効果的な時間モデリング手法を採用しています。トレーニングデータの拡張により、任意のキャラクタのアニメーション作成が可能になり、他の画像からビデオへの変換手法と比較して、キャラクタアニメーションにおいて優れた結果を得ています。さらに、ファッションビデオと人間のダンス合成のベンチマークにおいて最先端の結果を達成しました。
AI動画生成
11.4M