

TEN Agent
简介 :
TEN Agent 是基于 TEN 框架构建的实时对话 AI引擎,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,如AI虚拟客服、AI 口语陪练、AI 情感陪伴、AI 个人助理等。
TEN Agent 目前已集成 DeepSeek、Gemini 2.0、OpenAI Realtime、Qwen、RTC 等多种模型及组件,同时适配 Dify、Coze 主流编排工具,并且支持 ESP 32,快速让你的 AI bot 能听能说。
需求人群 :
目标受众为任何希望搭建 Voice Agent的开发者及企业,特别是希望构建低延迟、可打断的、实时语音和多模态对话功能的团队。TEN 既支持级联模式,也支持端到端模式,并且已经集成大量的STT、LLM、TTS 等插件,能够支持开发者灵活选择、快速调整,是 Voice Agent 开发者进行快速原型设计和产品开发的理想选择。
使用场景
AI 虚拟客服:通过语音让 AI 与客户进行交流,提高客户满意度或承担,同时支持 SIP 电话接入。
AI 口语陪练:与 AI 进行实时对话,提供实时的发音纠正、语法建议和表达方式优化,提高口语水平。
AI 情感陪伴:根据用户的实时情绪状态,提供个性化的回应和支持,例如安慰、鼓励、倾听等
AI 个人助理:解放双手,通过语音让用户能够通过语音指令控制设备、获取信息、完成任务。
产品特色
支持多模态与端到端模型,满足语音、文本和图像的输入与输出
内置优化后的实时通信能力,提供低延时、可打断的交互体验
集成全球主流 STT、LLM和 TTS等插件,灵活编排、快速开发
支持C++、 Go、 Python、 Node.JS等主流语言,Agent可跨平台无缝衔接
使用教程
1. 申请所需模块的 key:Agora + ASR + LLM + TTS
2. 安装前置软件: Docker + NodeJS18 +
3. 进入容器拉起环境
4. 进入虚拟机跑起 TEN Agent
5. 详细步骤操作可参考 readme及文档
精选AI产品推荐

Deepmind Gemini
Gemini是谷歌DeepMind推出的新一代人工智能系统。它能够进行多模态推理,支持文本、图像、视频、音频和代码之间的无缝交互。Gemini在语言理解、推理、数学、编程等多个领域都超越了之前的状态,成为迄今为止最强大的AI系统之一。它有三个不同规模的版本,可满足从边缘计算到云计算的各种需求。Gemini可以广泛应用于创意设计、写作辅助、问题解答、代码生成等领域。
AI模型
11.4M
中文精选

Liblibai
LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。
AI模型
8.0M