W.A.L.T
W
W.A.L.T
简介 :
W.A.L.T是一个基于transformer的实景视频生成方法,通过联合压缩图像和视频到一个统一的潜在空间,实现跨模态的训练和生成。它使用了窗注意力机制来提高内存和训练效率。该方法在多个视频和图像生成基准测试上取得了最先进的性能。
需求人群 :
["生成高保真视频","生成动画","生成视频预览"]
总访问量: 716
占比最多地区: US(70.37%)
本站浏览量 : 378.4K
使用场景
输入文本描述,生成相应的实景视频
输入图像,生成含有该图像内容的视频
输入视频几帧关键帧,生成完整细致的高清视频
产品特色
实景视频生成
图像生成
文本到视频生成
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase