

Kokoro Onnx
簡介 :
kokoro-onnx是一個基於Kokoro模型和ONNX運行時的文本到語音(TTS)項目。它支持英語,並計劃支持法語、日語、韓語和中文。該模型在macOS M1上具有接近即時的快速性能,並提供多種聲音選擇,包括耳語。模型輕量級,約為300MB(量化後約為80MB)。該項目在GitHub上開源,採用MIT許可證,方便開發者集成和使用。
需求人群 :
目標受眾主要是開發者和研究人員,他們可以利用該模型為應用程序添加文本到語音的功能,或者進行語音合成相關的研究和開發。由於其開源性和輕量級特性,適合希望在項目中集成高質量TTS功能但又不想從頭開始構建模型的開發者。
使用場景
為移動應用添加語音提示功能
在智能助手設備中集成,提供自然語言交互
用於語音合成研究,探索新的語音生成技術
產品特色
支持英語(即將支持法語、日語、韓語和中文)
在macOS M1上具有接近即時的快速性能
提供多種聲音選擇,包括耳語
模型輕量級,約為300MB(量化後約為80MB)
基於ONNX運行時,易於部署和集成
提供示例腳本,方便用戶快速上手
使用教程
1. 安裝uv(推薦)或使用常規Python環境
2. 創建新項目文件夾,並在其中運行uv init -p 3.12初始化項目
3. 使用uv add添加kokoro-onnx和soundfile依賴
4. 將examples/save.py的內容複製到hello.py中
5. 下載kokoro-v0_19.onnx和voices.json文件,並放置在項目目錄中
6. 運行uv run hello.py生成音頻文件
精選AI產品推薦

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。
AI模型
11.4M
優質新品

Fish Audio文本轉語音
文本轉語音技術是一種將文本信息轉換為語音的技術,廣泛應用於輔助閱讀、語音助手、有聲讀物製作等領域。它通過模擬人類語音,提高了信息獲取的便捷性,尤其對視力障礙者或在無法使用眼睛閱讀的情況下非常有幫助。
文本轉聲音
10.1M