AudioSep
A
Audiosep
简介 :
AudioSep是一种基于自然语言查询的开放领域音频源分离模型。它由文本编码器和分离模型两个关键组件组成。我们在大规模多模态数据集上训练AudioSep,并在许多任务上广泛评估其能力,包括音频事件分离、乐器分离和语音增强。AudioSep表现出强大的分离性能和令人印象深刻的零样本泛化能力,使用音频标题或文本标签作为查询,大大优于以前的音频查询和语言查询声音分离模型。为了保证本工作的可重复性,我们将发布源代码、评估基准和预训练模型。
需求人群 :
适用于音频分离领域,可用于音频处理、音频编辑等领域
总访问量: 20.4M
占比最多地区: US(29.22%)
本站浏览量 : 91.6K
使用场景
使用AudioSep分离音频中的吉他声音
使用AudioSep分离音频中的人声
使用AudioSep分离音频中的钢琴声音
产品特色
基于自然语言查询的音频源分离
支持开放领域音频概念分离
支持音频事件分离、乐器分离和语音增强
具有强大的分离性能和零样本泛化能力
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase