Lumiere : 時空間拡散モデルによるビデオ生成

Lumiere

AI動画生成 AI画像生成 #ビデオ合成 #テキストからビデオ #時空間拡散モデル通常製品オープンソース

紹介 :

Lumiereは、リアルで多様性があり、連続した動きを示すビデオを合成することを目的とした、テキストからビデオへの拡散モデルです。ビデオ合成における主要な課題の解決を目指しています。本モデルでは、ビデオ全体の時間的持続を一度に生成できる時空間U-Netアーキテクチャを導入しました。これは、遠距離のキーフレームを合成し、その後時間的超解像度処理を行う既存のビデオモデルとは対照的であり、この手法ではグローバルな時間的一貫性を達成することが本質的に困難です。空間と（重要なことですが）時間のダウンサンプリングとアップサンプリングを導入し、事前学習済みのテキストから画像への拡散モデルを活用することで、当モデルは全フレームレートの低解像度ビデオを複数の時空間スケールで直接生成することを学習します。最先端のテキストからビデオへの生成結果を示し、当モデルの設計が、画像からビデオ、ビデオ修復、スタイル変換生成など、様々なコンテンツ制作タスクやビデオ編集アプリケーションを容易に促進することを示します。

ターゲットユーザー :

ビデオ合成、画像からビデオ、ビデオ修復、スタイル変換生成などのコンテンツ制作やビデオ編集アプリケーションに適用可能です。

総訪問数： 26.1M

最も高い割合の地域： US(17.94%)

ウェブサイト閲覧数： 874.9K

使用シナリオ

ビデオ合成アプリケーションの利用例

画像からビデオへのアプリケーションの利用例

ビデオ修復アプリケーションの利用例

製品特徴

リアルで多様性があり、連続した動きを示すビデオの合成

ビデオ全体の時間的持続を一度に生成