FreGrad
F
Fregrad
简介 :
FreGrad是一款轻量快速的频率感知扩散声码器,旨在生成逼真的音频。其框架包括离散小波变换、频率感知扩张卷积和一系列增强模型生成质量的技巧。在实验中,FreGrad相比基准模型,训练速度提升3.7倍,推理速度提升2.2倍,同时模型大小减少0.6倍(仅178万参数),而不牺牲输出质量。
需求人群 :
FreGrad可用于音频生成、语音合成等场景。
总访问量: 29.7M
占比最多地区: US(17.94%)
本站浏览量 : 54.6K
使用场景
音频生成模型训练
语音合成应用
音频处理插件
产品特色
离散小波变换
频率感知扩张卷积
生成质量增强技巧
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase