Celebv Text : 大规模人脸文本-视频数据集

Celebv Text

CelebV-Text

Celebv Text

AI数据集 AI模型推理训练 #人脸 #文本 #视频 #数据集 #视频创作 #统计分析 #基准 #生成任务普通产品开源

简介 :

CelebV-Text是一个大规模、高质量、多样化的人脸文本-视频数据集，旨在促进人脸文本-视频生成任务的研究。数据集包含70,000个野外人脸视频剪辑，每个视频剪辑都配有20个文本，涵盖40种一般外观、5种详细外观、6种光照条件、37种动作、8种情绪和6种光线方向。CelebV-Text通过全面的统计分析验证了其在视频、文本和文本-视频相关性方面的优越性，并构建了一个基准来标准化人脸文本-视频生成任务的评估。

需求人群 :

用于人脸文本-视频生成任务的研究

总访问量： 1.5K

占比最多地区： US(100.00%)

本站浏览量： 91.4K

使用场景

使用CelebV-Text数据集进行人脸文本-视频生成任务的研究

使用CelebV-Text数据集进行人脸文本-视频相关性分析

使用CelebV-Text数据集构建人脸文本-视频生成任务的基准

产品特色

大规模人脸文本-视频数据集

70,000个野外人脸视频剪辑

每个视频剪辑都配有20个文本

涵盖40种一般外观、5种详细外观、6种光照条件、37种动作、8种情绪和6种光线方向

全面的统计分析验证数据集的优越性

构建了一个基准来标准化人脸文本-视频生成任务的评估

精选AI产品推荐

Teachable Machine

Teachable Machine

Teachable Machine是一个基于网页的工具,使用户可以快速轻松地创建机器学习模型,无需专业知识或编码能力。用户只需收集并整理样本数据,Teachable Machine将自动训练模型,然后用户可以测试模型准确性,最后将模型导出使用。

AI模型推理训练

OpenDiT

OpenDiT是一个开源项目，提供了一个基于Colossal-AI的Diffusion Transformer(DiT)的高性能实现，专为增强DiT应用（包括文本到视频生成和文本到图像生成）的训练和推理效率而设计。OpenDiT通过以下技术提升性能：在GPU上高达80%的加速和50%的内存减少；包括FlashAttention、Fused AdaLN和Fused layernorm核心优化；包括ZeRO、Gemini和DDP的混合并行方法，还有对ema模型进行分片进一步降低内存成本；FastSeq：一种新颖的序列并行方法，特别适用于DiT等工作负载，其中激活大小较大但参数大小较小；单节点序列并行可以节省高达48%的通信成本；突破单个GPU的内存限制，减少整体训练和推理时间；通过少量代码修改获得巨大性能改进；用户无需了解分布式训练的实现细节；完整的文本到图像和文本到视频生成流程；研究人员和工程师可以轻松使用和调整我们的流程到实际应用中，无需修改并行部分；在ImageNet上进行文本到图像训练并发布检查点。

AI模型推理训练

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase