国外精选

Gstory
GStory是一个在线视频和图片编辑平台,提供多种智能编辑功能,如背景更换、增强器、水印去除和AI图像生成器。它通过AI技术简化商业视频编辑流程,提高效率,降低成本,并被超过50,000家不同规模的公司所信赖。
AI视频编辑
101.0K

Talking Avatar
Talking Avatar是一款利用人工智能技术,允许用户通过编辑文本来更新旁白,无需重新录制,即可改变声音,包括口音、语调和情感。它支持一键多人唇形同步,确保视频观看体验自然而沉浸。此外,它还支持一句话声音克隆技术,用户只需提供一句话的音频样本,即可克隆任何声音,并用于生成任何语音。这款产品对于视频创作者、广告代理商、市场营销人员和教育工作者等都是一个强大的工具,可以轻松地将经典视频片段转化为新的热门内容,或者为不同平台优化视频内容。
AI视频编辑
105.2K

Sieve Eye Contact Correction
Sieve Eye Contact Correction API 是一个为开发者设计的快速且高质量的视频眼神校正API。该技术通过重定向眼神,确保视频中的人物即使没有直接看向摄像头,也能模拟出与摄像头进行眼神交流的效果。它支持多种自定义选项来微调眼神重定向,保留了原始的眨眼和头部动作,并通过随机的“看向别处”功能来避免眼神呆板。此外,还提供了分屏视图和可视化选项,以便于调试和分析。该API主要面向视频制作者、在线教育提供者和任何需要提升视频交流质量的用户。定价为每分钟视频0.10美元。
AI视频编辑
118.1K

Video Background Removal
Video Background Removal 是一个由 innova-ai 提供的 Hugging Face Space,专注于视频背景移除技术。该技术通过深度学习模型,能够自动识别并分离视频中的前景和背景,实现一键去除视频背景的功能。这项技术在视频制作、在线教育、远程会议等多个领域都有广泛的应用,尤其在需要抠图或更换视频背景的场景下,提供了极大的便利。产品背景信息显示,该技术是基于开源社区 Hugging Face 的 Spaces 平台开发的,继承了开源、共享的技术理念。目前,产品提供免费试用,具体价格信息需进一步查询。
AI视频编辑
172.2K
国外精选

Eddie AI
Eddie AI是一个创新的视频编辑平台,它利用人工智能技术帮助用户快速、轻松地编辑视频。这个平台的主要优点是它的用户友好性和高效率,它允许用户像与另一个编辑交谈一样与AI对话,提出他们想要的视频剪辑类型。Eddie AI的背景信息显示,它旨在通过使用自定义的AI编辑/故事模型来扩展视频编辑的规模,这表明它在视频制作领域具有潜在的革命性影响。
AI视频编辑
57.1K

Voice Pro
Voice-Pro是一个集成的字幕、翻译和文本到语音(TTS)解决方案。它支持将视频添加多语言字幕和多语言音频,助力视频内容扩展到全球市场。该产品使用OpenAI Whisper和开源翻译器及TTS技术,提供一键安装和便携式使用。它还配备了Vocal Remover,使用UVR5和Meta的Demucs引擎,以提高语音识别的准确性。
AI视频编辑
72.0K

Elevenlabsdubbinggradio
ElevenLabs Video Dubbing Application 是一个用户友好的界面,用于使用 ElevenLabs API 配音视频。该应用允许用户上传视频文件或提供视频网址(来自 YouTube、TikTok、Twitter 或 Vimeo 等平台),并将其配音成各种语言。应用使用 Gradio 提供易于使用的 Web 界面。
AI视频编辑
51.9K

Portraitgen
PortraitGen是一个基于多模态生成先验的2D肖像视频编辑工具,能够将2D肖像视频提升到4D高斯场,实现多模态肖像编辑。该技术通过追踪SMPL-X系数和使用神经高斯纹理机制,可以快速生成3D肖像并进行编辑。它还提出了一种迭代数据集更新策略和多模态人脸感知编辑模块,以提高表情质量和保持个性化面部结构。
AI视频编辑
102.7K

AI Youtube Shorts Generator
AI Youtube Shorts Generator 是一个利用GPT-4和Whisper技术的Python工具,它可以从长视频中提取最有趣的亮点,检测演讲者,并将内容垂直裁剪,以适应短片格式。这个工具目前处于0.1版本,可能存在一些bug。
AI视频编辑
62.9K

Doesvideocontain
doesVideoContain是一个利用人工智能在浏览器中检测视频内容的模型。它允许用户通过简单的英语句子描述来自动抓取视频截图,识别视频中的重要时刻。这个模型完全在客户端运行,保护用户隐私,无需支付API费用,并且可以处理本地大文件,无需上传至云端。它使用了Web AI生态系统中的Transformers.js和ONNX Runtime Web,结合了自定义逻辑来执行余弦相似度计算。
AI视频编辑
118.7K

Svd Keyframe Interpolation
Svd Keyframe Interpolation 是一个基于奇异值分解(SVD)技术的关键帧插值模型,用于在动画制作中自动生成中间帧,从而提高动画师的工作效率。该技术通过分析关键帧的特征,自动计算出中间帧的图像,使得动画更加流畅自然。它的优势在于能够减少动画师手动绘制中间帧的工作量,同时保持高质量的动画效果。
AI视频编辑
59.1K

Davinci Resolve 19
DaVinci Resolve 19是一款专业的剪辑、调色、特效和音频后期制作软件,它提供一站式的后期制作解决方案,适用于从新手到好莱坞专业人士的广泛用户群体。该软件以其强大的功能、易用性以及支持多种工作流程而闻名,包括但不限于剪辑、调色、视觉特效、动态图形和音频后期制作。DaVinci Resolve 19新增了DaVinci Neural Engine AI工具,对100多项功能进行了升级,提供了更高效的工作效率和更优质的作品制作能力。
AI视频编辑
55.8K
国外精选

Captions API
Captions是一个提供视频生成和编辑服务的AI平台,它利用先进的人工智能技术,帮助用户快速生成和编辑视频内容。该平台拥有多项功能,如AI视频编辑器、AI广告生成器等,旨在提高视频制作的效率和质量,同时降低技术门槛,使视频内容创作更加便捷。
AI视频编辑
72.6K

Narratoai
NarratoAI是一个利用AI大模型,一键解说并剪辑视频的工具。它提供了剧本编写、自动视频剪辑、配音和字幕生成的一站式解决方案,由LLM驱动,以提高内容创作的效率。
AI视频编辑
127.0K

Segment Anything 2 For Surgical Video Segmentation
Segment Anything 2 for Surgical Video Segmentation 是一个基于Segment Anything Model 2的手术视频分割模型。它利用先进的计算机视觉技术,对手术视频进行自动分割,以识别和定位手术工具,提高手术视频分析的效率和准确性。该模型适用于内窥镜手术、耳蜗植入手术等多种手术场景,具有高精度和高鲁棒性的特点。
AI视频编辑
66.8K
优质新品

Videodoodles
VideoDoodles是一个交互式系统,它通过让用户在3D场景中放置平面画布,然后对这些画布进行追踪,以简化视频涂鸦的创作过程。这种技术允许手绘动画在视频中具有正确的透视变形和遮挡效果,并且能够随着摄像机和其他场景中的对象移动而移动。该系统支持用户通过2D图像空间UI精细控制画布,通过关键帧设置位置和方向,并自动插值关键帧以追踪视频中移动对象的运动。
AI视频编辑
147.1K

Jockey
Jockey是一个基于Twelve Labs API和LangGraph构建的对话式视频代理。它将现有的大型语言模型(Large Language Models, LLMs)的能力与Twelve Labs的API结合使用,通过LangGraph进行任务分配,将复杂视频工作流程的负载分配给适当的基础模型。LLMs用于逻辑规划执行步骤并与用户交互,而与视频相关的任务则传递给由视频基础模型(Video Foundation Models, VFMs)支持的Twelve Labs API,以原生方式处理视频,无需像预先生成的字幕这样的中介表示。
AI视频编辑
52.2K
优质新品

NVIDIA Broadcast App
NVIDIA Broadcast App 是一款利用人工智能技术,为直播和视频会议提供高质量语音和视频效果的应用。它通过智能降噪、虚拟背景、眼神接触增强等功能,为用户提供专业级别的直播体验。这款应用特别适合内容创作者、游戏主播和需要进行远程视频会议的专业人士。它的优势在于能够显著提升视频内容的质量,同时简化直播流程,无需昂贵的硬件设备。
AI视频编辑
82.2K

DJI Mimo
DJI Mimo 是大疆创新为手持稳定设备打造的专属应用,它不仅能够精准控制云台相机,实现实时预览拍摄画面,还提供了一系列智能功能和专业模式,以激发用户的创作灵感。该应用支持蓝牙或Wi-Fi无线连接,具备人脸识别和美颜功能,提供视频剪辑功能,包括字幕、贴纸、特效、音乐等多轨道编辑。AI自动化剪辑能力,智能分析素材提取高光片段,一键成片。此外,DJI Mimo 还提供海量主题模板,丰富的编辑素材资源,以及专业编辑器功能,适合新手和专业用户使用。
AI视频编辑
51.1K
优质新品

Diffutoon
Diffutoon是一种先进的动漫风格渲染技术,能够将逼真的视频转换成动漫风格,适用于高分辨率和快速运动的视频。源代码已在DiffSynth-Studio发布,同时发布了技术报告。
AI视频编辑
286.2K

Final Cut Pro
Final Cut Pro 是 Apple 推出的专业视频编辑软件,适用于 iPad 和 Mac 设备。最新版本利用了 M4 芯片的强大性能,提供了更快的渲染速度和对 ProRes RAW 视频流的增强支持。新增的 AI 功能,包括“优化光线和颜色”和“流畅慢动作”,以及改进的素材管理工具,极大地提升了视频编辑的效率和质量。
AI视频编辑
50.8K

Deepfuze
DeepFuze是与ComfyUI无缝集成的先进深度学习工具,用于革新面部转换、lipsyncing、视频生成、声音克隆和lipsync翻译。利用先进的算法,DeepFuze使用户能够以无与伦比的真实性结合音频和视频,确保完美的面部动作同步。这一创新解决方案非常适合内容创作者、动画师、开发者以及任何希望以先进的AI驱动功能提升其视频编辑项目的人士。
AI视频编辑
74.2K

Motionfollower
MotionFollower是一个轻量级的得分引导扩散模型,用于视频运动编辑。它通过两个轻量级信号控制器,分别对姿势和外观进行控制,不涉及繁重的注意力计算。该模型设计了基于双分支架构的得分引导原则,包括重建和编辑分支,显著增强了对纹理细节和复杂背景的建模能力。实验表明,MotionFollower在GPU内存使用上比最先进的运动编辑模型MotionEditor减少了约80%,同时提供了更优越的运动编辑性能,并独家支持大范围的摄像机运动和动作。
AI视频编辑
122.0K
优质新品

MASA
MASA是一个用于视频帧中对象匹配的先进模型,它能够处理复杂场景中的多目标跟踪(MOT)。MASA不依赖于特定领域的标注视频数据集,而是通过Segment Anything Model(SAM)丰富的对象分割,学习实例级别的对应关系。MASA设计了一个通用适配器,可以与基础的分割或检测模型配合使用,实现零样本跟踪能力,即使在复杂领域中也能表现出色。
AI视频编辑
66.0K

Detail
Detail是一款专为iPad设计的APP,适用于TikTok爱好者、播客创作者和Instagram影响者。它集成了强大的视频编辑器、便捷的提词器、智能字幕和尖端的摄像技术,通过AI驱动的编辑功能和即时视频预设,使创建惊人视频变得快速而简单。
AI视频编辑
53.8K
中文精选

快影
快影是快手官方推出的视频剪辑应用,提供全面的视频编辑功能,包括剪辑、音频、字幕、特效等,旨在帮助用户轻松创作出有趣且专业的视频内容。它具备AI动漫视频功能,能够将视频转化为动漫风格,提供多种风格选择,如动漫风、国潮风、日漫风等。此外,快影还拥有AI创作工具,如AI绘画、AI文生图、AI文案库,以辅助用户进行创作。快影还提供创作中心,帮助用户查看数据、寻找灵感,以及提供强大的素材库,包括贴纸、热梗等,以提升用户的网感。
AI视频编辑
236.5K

Underlord
Underlord是Descript平台内的一个AI驱动的视频和播客编辑助手,它通过一系列智能编辑工具,帮助用户简化视频和音频内容的编辑过程,提高制作效率和质量。产品背景信息显示,Underlord致力于通过AI技术,让创意工作更加流畅,同时减少后期编辑的繁琐工作。
AI视频编辑
54.6K
优质新品

Vivid
ViViD是一个利用扩散模型进行视频虚拟试穿的新框架。它通过设计服装编码器提取精细的服装语义特征,并引入轻量级姿态编码器以确保时空一致性,生成逼真的视频试穿效果。ViViD收集了迄今为止规模最大、服装类型最多样化、分辨率最高的视频虚拟试穿数据集。
AI视频编辑
212.5K
优质新品

I2vedit
I2VEdit是一种创新的视频编辑技术,通过预训练的图像到视频模型,将单一帧的编辑扩展到整个视频。这项技术能够适应性地保持源视频的视觉和运动完整性,并有效处理全局编辑、局部编辑以及适度的形状变化,这是现有方法所不能实现的。I2VEdit的核心包括两个主要过程:粗略运动提取和外观细化,通过粗粒度注意力匹配进行精确调整。此外,还引入了跳过间隔策略,以减轻多个视频片段自动回归生成过程中的质量下降。实验结果表明,I2VEdit在细粒度视频编辑方面的优越性能,证明了其能够产生高质量、时间一致的输出。
AI视频编辑
180.2K

Comfyui ProPainter Nodes
ComfyUI ProPainter Nodes 是基于 ProPainter 框架的视频修补插件,利用流传播和时空转换器实现高级视频帧编辑,适用于无缝修补任务。该插件具有用户友好的界面和强大的功能,旨在简化视频修补过程。
AI视频编辑
76.5K
- 1
- 2
- 3
- 4
精选AI产品推荐
中文精选

Nocode
NoCode 是一款无需编程经验的平台,允许用户通过自然语言描述创意并快速生成应用,旨在降低开发门槛,让更多人能实现他们的创意。该平台提供实时预览和一键部署功能,非常适合非技术背景的用户,帮助他们将想法转化为现实。
开发平台
98.3K
优质新品

Listenhub
ListenHub 是一款轻量级的 AI 播客生成工具,支持中文和英语,基于前沿 AI 技术,能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果,使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度,还兼容移动端,便于用户在不同场合使用。产品定位为高效的信息获取工具,适合广泛的听众需求。
音频生成
81.1K
国外精选

Lovart
Lovart 是一款革命性的 AI 设计代理,能够将创意提示转化为艺术作品,支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程,节省时间并提升创意灵感。Lovart 当前处于测试阶段,用户可加入等候名单,随时体验设计的乐趣。
AI设计工具
100.7K

Fastvlm
FastVLM 是一种高效的视觉编码模型,专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器,减少了高分辨率图像的编码时间和输出的 token 数量,使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力,适用于各种应用场景,尤其在需要快速响应的移动设备上表现优异。
AI模型
83.4K
国外精选

Smart PDFs
Smart PDFs 是一个在线工具,利用 AI 技术快速分析 PDF 文档,并生成简明扼要的总结。它适合需要快速获取文档要点的用户,如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型,支持多种语言,是提高工作效率的理想选择,完全免费使用。
文章摘要
51.3K

Keysync
KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题,同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果,适用于自动配音等实际应用场景。
视频编辑
79.2K

Anyvoice
AnyVoice是一款领先的AI声音生成器,采用先进的深度学习模型,将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景,如内容创作、教育、商业和娱乐制作等,旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用,适合不同层次的用户。
音频生成
651.1K
中文精选

Liblibai
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。
AI模型
8.0M