FreGrad
F
Fregrad
簡介 :
FreGrad是一款輕量快速的頻率感知擴散聲碼器,旨在生成逼真的音頻。其框架包括離散小波變換、頻率感知擴張卷積和一系列增強模型生成質量的技巧。在實驗中,FreGrad相比基準模型,訓練速度提升3.7倍,推理速度提升2.2倍,同時模型大小減少0.6倍(僅178萬參數),而不犧牲輸出質量。
需求人群 :
FreGrad可用於音頻生成、語音合成等場景。
總訪問量: 29.7M
佔比最多地區: US(17.94%)
本站瀏覽量 : 52.7K
使用場景
音頻生成模型訓練
語音合成應用
音頻處理插件
產品特色
離散小波變換
頻率感知擴張卷積
生成質量增強技巧
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase