Kokoro Onnx : 基於Kokoro和ONNX運行時的文本到語音（TTS）項目。

文本轉聲音

Kokoro Onnx

kokoro-onnx

Kokoro Onnx

文本轉聲音 AI模型 #TTS #語音合成 #ONNX #開源 #輕量級普通產品開源

簡介 :

kokoro-onnx是一個基於Kokoro模型和ONNX運行時的文本到語音（TTS）項目。它支持英語，並計劃支持法語、日語、韓語和中文。該模型在macOS M1上具有接近即時的快速性能，並提供多種聲音選擇，包括耳語。模型輕量級，約為300MB（量化後約為80MB）。該項目在GitHub上開源，採用MIT許可證，方便開發者集成和使用。

需求人群 :

目標受眾主要是開發者和研究人員，他們可以利用該模型為應用程序添加文本到語音的功能，或者進行語音合成相關的研究和開發。由於其開源性和輕量級特性，適合希望在項目中集成高質量TTS功能但又不想從頭開始構建模型的開發者。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 74.5K

使用場景

為移動應用添加語音提示功能

在智能助手設備中集成，提供自然語言交互

用於語音合成研究，探索新的語音生成技術

產品特色

支持英語（即將支持法語、日語、韓語和中文）

在macOS M1上具有接近即時的快速性能

提供多種聲音選擇，包括耳語

模型輕量級，約為300MB（量化後約為80MB）

基於ONNX運行時，易於部署和集成

提供示例腳本，方便用戶快速上手

使用教程

1. 安裝uv（推薦）或使用常規Python環境

2. 創建新項目文件夾，並在其中運行uv init -p 3.12初始化項目

3. 使用uv add添加kokoro-onnx和soundfile依賴

4. 將examples/save.py的內容複製到hello.py中

5. 下載kokoro-v0_19.onnx和voices.json文件，並放置在項目目錄中

6. 運行uv run hello.py生成音頻文件

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

Fish Audio文本轉語音

Fish Audio文本轉語音

文本轉語音技術是一種將文本信息轉換為語音的技術，廣泛應用於輔助閱讀、語音助手、有聲讀物製作等領域。它通過模擬人類語音，提高了信息獲取的便捷性，尤其對視力障礙者或在無法使用眼睛閱讀的情況下非常有幫助。

文本轉聲音

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase