Mardini : 大規模視頻生成的自迴歸擴散模型

Mardini

MarDini

Mardini

視頻生成圖片生成 #視頻生成 #自迴歸 #擴散模型 #大規模 #空間-時間注意力普通產品開源

簡介 :

MarDini是Meta AI Research推出的一款視頻擴散模型，它將掩碼自迴歸（MAR）的優勢整合到統一的擴散模型（DM）框架中。該模型能夠根據任意數量的掩碼幀在任意幀位置進行視頻生成，支持視頻插值、圖像到視頻生成以及視頻擴展等多種視頻生成任務。MarDini的設計高效，將大部分計算資源分配給低分辨率規劃模型，使得在大規模上進行空間-時間注意力成為可能。MarDini在視頻插值方面樹立了新的標杆，並且在幾次推理步驟內，就能高效生成與更昂貴的高級圖像到視頻模型相媲美的視頻。

需求人群 :

MarDini的目標受眾是視頻製作者、動畫師、遊戲開發者以及任何需要視頻內容生成的專業人士。它適合他們，因為它提供了一種高效、靈活且可擴展的方式來生成視頻內容，無需複雜的預處理或後期編輯。

總訪問量： 526

本站瀏覽量： 53.8K

使用場景

使用MarDini從單張圖片生成一系列連貫的視頻幀，用於社交媒體視頻內容的快速製作。

在遊戲開發中，利用MarDini生成動態背景視頻，增加遊戲環境的真實感。

在電影製作中，通過MarDini生成中間幀，用於慢動作視頻效果的製作。

產品特色

- 視頻插值：在給定首尾幀的情況下，生成中間幀，實現視頻插值。

- 圖像到視頻生成：從第二幀開始掩碼，實現圖像到視頻的生成。

- 視頻擴展：在給定視頻基礎上，通過掩碼擴展視頻，增加新幀。

- 長時視頻生成：通過遞歸插值，從少量圖像生成長時間視頻。

- 3D視圖合成：儘管僅在視頻數據上訓練，MarDini展現出初步的空間理解能力，為3D應用提供可能。

- 靈活性：通過靈活的掩碼策略，支持多種視頻生成任務。

- 可擴展性：MarDini能夠從零開始大規模訓練，無需依賴基於圖像的預訓練。

- 高效率：在推理期間內存效率高且速度快，允許大規模部署計算密集型的空間-時間注意力機制。

使用教程

1. 訪問MarDini的產品頁面並下載相關模型和代碼。

2. 根據文檔說明，設置所需的視頻生成任務，包括選擇掩碼策略和視頻參數。

3. 準備輸入數據，如單張圖片或視頻序列，並按照要求的格式進行預處理。

4. 使用MarDini模型對輸入數據進行推理，生成視頻內容。

5. 根據需要對生成的視頻進行後處理，如剪輯、調色等。

6. 將最終的視頻內容用於所需的應用場景，如社交媒體發佈、遊戲內視頻或電影製作。

精選AI產品推薦

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

Haiper

Haiper AI 是構建下一代內容創作的最佳感知基礎模型的使命。它提供以下主要功能：文本轉視頻，圖片動畫，視頻重繪，導演視角。Haiper AI 可以將文字內容和靜態圖片無縫轉化為動態視頻，只需拖放圖像即可使其栩栩如生。使用 Haiper AI 的重繪工具，您可以輕鬆修改視頻的顏色、紋理和元素，以提升視覺內容的品質。通過高級控制工具，您可以像導演一樣調整鏡頭角度、燈光效果、角色姿勢和物體運動。Haiper AI 適用於各種場景，如內容創作、設計、營銷等。定價請參考官方網站。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase