genmoai
G
Genmoai
簡介 :
genmoai/models 是一個開源的視頻生成模型,代表了視頻生成技術的最新進展。該模型名為 Mochi 1,是一個基於 Asymmetric Diffusion Transformer (AsymmDiT) 架構的10億參數擴散模型,從零開始訓練,是迄今為止公開發布的最大的視頻生成模型。它具有高保真運動和強提示遵循性,顯著縮小了封閉和開放視頻生成系統之間的差距。該模型在 Apache 2.0 許可下發布,用戶可以在 Genmo 的 playground 上免費試用此模型。
需求人群 :
目標受眾為視頻製作者、遊戲開發者、動畫師以及任何對視頻生成技術感興趣的研究人員和開發者。這款模型因其開源特性,特別適合那些希望在視頻生成領域進行創新和實驗的用戶。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 52.4K
使用場景
視頻製作者可以使用此模型生成具有特定動作和背景的定製視頻內容。
遊戲開發者可以利用模型在遊戲內生成動態視頻背景或劇情動畫。
研究人員可以在此基礎上進一步開發,探索視頻生成技術的更多可能性。
產品特色
使用 Asymmetric Diffusion Transformer (AsymmDiT) 架構,具有10億參數的擴散模型。
通過 AsymmVAE 模型實現視頻的高效壓縮,壓縮比達到128倍。
支持從命令行直接生成視頻或通過 Gradio 用戶界面操作。
模型對用戶提示的處理僅使用單個 T5-XXL 語言模型進行編碼。
模型需要至少4個 H100 GPU 才能運行,社區正在努力降低這一要求。
在研究預覽階段,生成的視頻分辨率為480p,可能在極端運動情況下出現輕微形變。
模型優化為照片般真實風格,不適合動畫內容的生成。
使用教程
1. 使用 Git 克隆 genmoai/models 倉庫到本地。
2. 安裝並設置好虛擬環境。
3. 安裝必要的依賴項。
4. 下載模型權重到本地目錄。
5. 使用提供的命令行工具或 Gradio UI 啟動視頻生成過程。
6. 根據需要調整生成參數,如提示、種子值等。
7. 運行生成命令,模型將根據輸入的提示生成視頻。
8. 檢查生成的視頻是否滿足要求,必要時進行微調。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase