CogVideoX-2B
C
Cogvideox 2B
简介 :
CogVideoX-2B是一个开源的视频生成模型,由清华大学团队开发。它支持使用英语提示语言生成视频,具有36GB的推理GPU内存需求,并且可以生成6秒长、每秒8帧、分辨率为720*480的视频。该模型使用正弦位置嵌入,目前不支持量化推理和多卡推理。它基于Hugging Face的diffusers库进行部署,能够根据文本提示生成视频,具有高度的创造性和应用潜力。
需求人群 :
该产品适合需要生成视频内容的创意专业人士,如视频编辑、动画制作者、游戏开发者等。它可以帮助用户快速将文本描述转化为视觉内容,提高创作效率,丰富创意表达。
总访问量: 29.7M
占比最多地区: US(17.94%)
本站浏览量 : 86.4K
使用场景
生成一个熊猫在竹林中弹吉他的视频
创造一个玩具船在地毯上航行的场景
制作一个街头艺术家在墙上喷涂彩色鸟的视频
产品特色
支持英语提示生成视频
需要36GB GPU内存进行推理
生成6秒长的视频,每秒8帧
视频分辨率为720*480
使用正弦位置嵌入技术
基于Hugging Face diffusers库部署
使用教程
安装必要的依赖项
导入torch和diffusers库
从预训练模型中加载CogVideoXPipeline
将文本提示编码为模型可以理解的嵌入
使用模型生成视频帧
将生成的视频帧导出为视频文件
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase