

Whisper Input
简介 :
Whisper Input 是一个基于 Python 开发的桌面工具,能够实现快速语音转文字功能。它支持通过按键控制录制语音,并调用 Groq Whisper Large V3 Turbo 或 FunAudioLLM/SenseVoiceSmall 模型进行转译。该工具的主要优点是转译速度快、准确率高,并且支持多语言转译。它适合需要高效输入的用户,尤其是那些经常需要进行语音记录和文字转换的场景。目前该工具完全免费,用户无需付费即可使用。
需求人群 :
适合需要高效语音输入的用户,如办公人员、学生、内容创作者等,尤其适用于需要快速记录想法、会议纪要、写作等场景。
使用场景
在会议中快速记录要点,无需手动输入。
学生在课堂上通过语音记录笔记,课后转为文字复习。
内容创作者通过语音输入撰写文章或脚本。
产品特色
支持按下 Option 或 Alt 按钮开始录制,抬起按钮结束录制。
支持多语言语音转译,可将多种语言转译为文字。
支持中文翻译为英文,满足双语输入需求。
调用 Groq 或 SiliconFlow 提供的高性能语音转录模型,转译速度快。
自带标点符号支持,无需额外润色即可输出完整句子。
使用教程
1. 确保本地有 Python 环境,版本不低于 3.10。
2. 注册 Groq 或 SiliconFlow 账户,获取免费的 API KEY。
3. 克隆项目到本地:`git clone git@github.com:ErlichLiu/Whisper-Input.git`。
4. 创建虚拟环境并激活:`python -m venv venv`,然后运行 `source venv/bin/activate`(macOS/Linux)或 `.\venv\Scripts\activate`(Windows)。
5. 安装依赖:`pip install pip-tools`,然后运行 `pip-compile requirements.in` 和 `pip install -r requirements.txt`。
6. 配置 `.env` 文件,填入 API KEY 和相关设置。
7. 运行程序:`python main.py`,即可通过按键进行语音转文字操作。
精选AI产品推荐

Video2text
Video2Text 是一个使用 OpenAI Whisper 技术的视频转文字工具。它使用先进的算法,提供准确的视频转文字功能。该工具可免费下载使用,可以将视频快速转换为文字。适用于研究人员、教育工作者、记者和内容创作者等各类用户。如有任何问题,请通过 contact@jhayer.tech 联系我们。
语音转文本
1.8M

Magic ToDo
Magic ToDo是一个具有特殊功能的标准待办事项清单。它可以根据你设定的辛辣程度自动生成任务的步骤,辛辣程度越高,生成的步骤越多。你可以使用表情符号来指示任务的辛辣程度。该工具还会自动为顶级任务分配一个由表情符号表示的类别。你可以使用过滤器按钮来过滤一个或多个类别的任务。此外,每个任务还提供了编辑、删除、添加子任务和估计等常见任务工具。你可以拖动左侧的图标来重新排序任务。该工具还提供了整个列表的其他操作,包括设备之间的同步、导出选项、撤销和重做以及批量操作。
效率工具
1.3M