Whisper-Input
W
Whisper Input
简介 :
Whisper Input 是一个基于 Python 开发的桌面工具,能够实现快速语音转文字功能。它支持通过按键控制录制语音,并调用 Groq Whisper Large V3 Turbo 或 FunAudioLLM/SenseVoiceSmall 模型进行转译。该工具的主要优点是转译速度快、准确率高,并且支持多语言转译。它适合需要高效输入的用户,尤其是那些经常需要进行语音记录和文字转换的场景。目前该工具完全免费,用户无需付费即可使用。
需求人群 :
适合需要高效语音输入的用户,如办公人员、学生、内容创作者等,尤其适用于需要快速记录想法、会议纪要、写作等场景。
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 78.1K
使用场景
在会议中快速记录要点,无需手动输入。
学生在课堂上通过语音记录笔记,课后转为文字复习。
内容创作者通过语音输入撰写文章或脚本。
产品特色
支持按下 Option 或 Alt 按钮开始录制,抬起按钮结束录制。
支持多语言语音转译,可将多种语言转译为文字。
支持中文翻译为英文,满足双语输入需求。
调用 Groq 或 SiliconFlow 提供的高性能语音转录模型,转译速度快。
自带标点符号支持,无需额外润色即可输出完整句子。
使用教程
1. 确保本地有 Python 环境,版本不低于 3.10。
2. 注册 Groq 或 SiliconFlow 账户,获取免费的 API KEY。
3. 克隆项目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。
4. 创建虚拟环境并激活:`python -m venv venv`,然后运行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。
5. 安装依赖:`pip install pip-tools`,然后运行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。
6. 配置 `.env` 文件,填入 API KEY 和相关设置。
7. 运行程序:`python main.py`,即可通过按键进行语音转文字操作。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase