InspireMusic
I
Inspiremusic
簡介 :
InspireMusic 是一個專注於音樂、歌曲和音頻生成的 AIGC 工具包和模型框架,採用 PyTorch 開發。它通過音頻標記化和解碼過程,結合自迴歸 Transformer 和條件流匹配模型,實現高質量音樂生成。該工具包支持文本提示、音樂風格、結構等多種條件控制,能夠生成 24kHz 和 48kHz 的高質量音頻,並支持長音頻生成。此外,它還提供了方便的微調和推理腳本,方便用戶根據需求調整模型。InspireMusic 的開源旨在賦能普通用戶通過音樂創作提升研究中的音效表現。
需求人群 :
該產品適合音樂創作者、音頻工程師、研究人員以及任何需要通過文字生成音樂或對音樂生成模型進行研究和開發的人群。創作者可以利用其文本到音樂的功能快速生成靈感音頻,研究人員可以基於其開源代碼和模型進行進一步的算法優化和功能拓展。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 105.2K
使用場景
使用文本提示生成舒緩的爵士樂,適用於餐廳或水療中心背景音樂
基於一段爵士樂音頻片段,繼續生成後續音樂內容
通過模型生成 48kHz 高採樣率的高質量古典音樂
產品特色
支持文本到音樂生成,可根據文本描述生成對應風格的音樂
支持音樂續寫任務,可基於已有音頻片段繼續生成音樂
支持多種音頻採樣率(24kHz 和 48kHz),滿足不同質量需求
提供長音頻生成能力,可生成超過 5 分鐘的音樂
支持混合精度訓練(FP16、BF16、FP32),提高訓練效率
提供方便的微調和推理腳本,簡化模型調整和部署流程
使用教程
1. 克隆倉庫:`git clone --recursive https://github.com/FunAudioLLM/InspireMusic.git`
2. 安裝依賴:創建 Conda 環境並安裝 Python 3.8 和 PyTorch 2.0.1,運行 `pip install -r requirements.txt`
3. 下載預訓練模型:從 ModelScope 或 HuggingFace 下載 InspireMusic 模型
4. 運行推理腳本:使用 `python -m inspiremusic.cli.inference` 命令進行文本到音樂的生成
5. 自定義生成參數:通過命令行參數調整生成任務、模型、文本提示、音頻時長等
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase