Whisper-Input
W
Whisper Input
簡介 :
Whisper Input 是一個基於 Python 開發的桌面工具,能夠實現快速語音轉文字功能。它支持通過按鍵控制錄製語音,並調用 Groq Whisper Large V3 Turbo 或 FunAudioLLM/SenseVoiceSmall 模型進行轉譯。該工具的主要優點是轉譯速度快、準確率高,並且支持多語言轉譯。它適合需要高效輸入的用戶,尤其是那些經常需要進行語音記錄和文字轉換的場景。目前該工具完全免費,用戶無需付費即可使用。
需求人群 :
適合需要高效語音輸入的用戶,如辦公人員、學生、內容創作者等,尤其適用於需要快速記錄想法、會議紀要、寫作等場景。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 74.2K
使用場景
在會議中快速記錄要點,無需手動輸入。
學生在課堂上通過語音記錄筆記,課後轉為文字複習。
內容創作者通過語音輸入撰寫文章或腳本。
產品特色
支持按下 Option 或 Alt 按鈕開始錄製,抬起按鈕結束錄製。
支持多語言語音轉譯,可將多種語言轉譯為文字。
支持中文翻譯為英文,滿足雙語輸入需求。
調用 Groq 或 SiliconFlow 提供的高性能語音轉錄模型,轉譯速度快。
自帶標點符號支持,無需額外潤色即可輸出完整句子。
使用教程
1. 確保本地有 Python 環境,版本不低於 3.10。
2. 註冊 Groq 或 SiliconFlow 賬戶,獲取免費的 API KEY。
3. 克隆項目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。
4. 創建虛擬環境並激活:`python -m venv venv`,然後運行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。
5. 安裝依賴:`pip install pip-tools`,然後運行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。
6. 配置 `.env` 文件,填入 API KEY 和相關設置。
7. 運行程序:`python main.py`,即可通過按鍵進行語音轉文字操作。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase