百聆
百
百聆
简介 :
百聆是一个开源的语音对话助手,旨在通过语音与用户进行自然的对话。该项目结合了语音识别(ASR)、语音活动检测(VAD)、大语言模型(LLM)和语音合成(TTS)技术,提供高质量的语音对话体验。其主要优点是无需GPU即可实现类GPT-4o的对话效果,适用于各种边缘设备和低资源环境。百聆完全开源,鼓励社区贡献与二次开发,用户可以根据自己的需求进行定制和优化。
需求人群 :
该产品适合需要高效语音交互体验的用户,无论是日常对话、信息查询还是任务管理,百聆都能提供便捷的语音支持,尤其适合对硬件配置要求不高但对语音交互质量有较高要求的用户。
总访问量: 474.6M
占比最多地区: US(19.34%)
本站浏览量 : 67.6K
使用场景
用户可以通过语音指令让百聆查询天气情况,如说‘杭州天气怎么样?’,百聆会返回杭州的天气信息。
用户可以使用百聆进行雅思口语练习,百聆会生成雅思口语练习题目和对话,帮助用户进行练习。
用户可以设置定时任务,如说‘每天早上8点提醒我喝水。’,百聆会按照设定的时间提醒用户。
产品特色
高效开源模型:百聆使用多个开源模型,确保高效、可靠的语音对话体验。
无需GPU:通过优化,可本地部署,仍能提供类GPT-4的性能表现。
模块化设计:ASR、VAD、LLM和TTS模块相互独立,可根据需求进行替换和升级。
支持记忆功能:具备持续学习能力,能够记忆用户的偏好与历史对话,提供个性化的互动体验。
支持工具调用:灵活集成外部工具,用户可通过语音直接请求信息或执行操作,提升助手的实用性。
支持任务管理:高效管理用户任务,能够跟踪进度、设置提醒,并提供动态更新,确保用户不错过任何重要事项。
使用教程
1. 克隆项目仓库:git clone https://github.com/wwbin2017/bailing.git,然后进入项目目录cd bailing。
2. 安装所需依赖:pip install -r requirements.txt。
3. 配置环境变量:打开config/config.yaml配置ASR LLM等相关配置,下载SenseVoiceSmall到目录models/SenseVoiceSmall,并获取deepseek的api_key。
4. 启动后端服务:cd server,运行python server.py(可选)。
5. 启动主程序:运行python main.py,系统会等待语音输入,用户即可开始使用百聆进行语音对话。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase