Wan2.1-T2V-14B
W
Wan2.1 T2V 14B
Overview :
Wan2.1-T2V-14B 是一款先進的文本到視頻生成模型,基於擴散變換器架構,結合了創新的時空變分自編碼器(VAE)和大規模數據訓練。它能夠在多種分辨率下生成高質量的視頻內容,支持中文和英文文本輸入,並在性能和效率上超越現有的開源和商業模型。該模型適用於需要高效視頻生成的場景,如內容創作、廣告製作和視頻編輯等。目前該模型在 Hugging Face 平臺上免費提供,旨在推動視頻生成技術的發展和應用。
Target Users :
該模型適用於需要高效生成高質量視頻內容的創作者、廣告商、視頻編輯人員以及研究人員。它能夠快速將文本或圖像轉化為生動的視頻,節省創作時間和成本,同時支持多種語言輸入,拓寬了其在全球範圍內的應用前景。
Total Visits: 29.7M
Top Region: US(17.94%)
Website Views : 73.1K
Use Cases
根據輸入的文本描述生成一段 5 秒的 480P 視頻
將靜態圖像轉化為具有動態效果的視頻
結合文本提示生成包含中文或英文文字的視頻內容
Features
支持文本到視頻、圖像到視頻等多種視頻生成任務
支持 480P 和 720P 分辨率的視頻生成
具備強大的時空壓縮能力,可高效處理 1080P 視頻
支持中文和英文文本輸入,拓展應用場景
提供單 GPU 和多 GPU 推理代碼,適應不同硬件需求
How to Use
1. 克隆項目倉庫:`git clone https://github.com/Wan-Video/Wan2.1.git`
2. 安裝依賴:`pip install -r requirements.txt`
3. 下載模型權重:`huggingface-cli download Wan-AI/Wan2.1-T2V-14B --local-dir ./Wan2.1-T2V-14B`
4. 運行文本到視頻生成:`python generate.py --task t2v-14B --size 1280*720 --ckpt_dir ./Wan2.1-T2V-14B --prompt '描述文本'`
5. 根據需要調整參數,如分辨率、提示文本等
AIbase
Empowering the Future, Your AI Solution Knowledge Base
© 2025AIbase