Archgw
A
Archgw
简介 :
Arch是一个开源的网关,专为处理提示(prompts)而设计,它利用快速的大型语言模型(LLMs)来处理提示,并与后端系统无缝集成。Arch基于Envoy构建,支持任何应用程序语言,并提供快速部署和透明升级。它提供了包括流量管理、前端/边缘网关、监控和端到端追踪在内的多种功能,帮助开发者构建快速、健壮和个性化的GenAI应用。
需求人群 :
目标受众为开发者和企业,特别是那些需要构建和部署基于提示的GenAI应用的团队。Arch提供了一个强大的平台,使得开发者能够快速集成LLMs,优化用户体验,并提高应用的可观测性和可靠性。
总访问量: 146
占比最多地区: US(100.00%)
本站浏览量 : 51.1K
使用场景
使用Arch构建一个个性化的聊天机器人,通过用户提示调用后端API进行个性化响应。
利用Arch的流量管理功能,实现LLMs的智能重试和灾难恢复,保证AI应用的高可用性。
通过Arch的前端网关功能,实现TLS终止和基于提示的路由,提高AI应用的安全性和效率。
产品特色
基于Envoy的进程外架构:Arch依赖于Envoy,是一个自包含的过程,设计为与您的应用服务器一起运行。
与快速LLMs集成:Arch使用专为快速、成本效益高和准确处理提示而设计的专门(亚十亿)LLMs。
流量管理:提供LLM调用的多种能力,包括智能重试和自动切换到其他LLMs以保证连续可用性和灾难恢复。
前端/边缘网关:Arch非常适合作为AI应用的边缘网关,包括TLS终止、速率限制和基于提示的路由。
最佳监控:提供多个监控指标,帮助您了解应用的延迟、令牌使用情况和上游LLM提供商的错误率。
端到端追踪:Arch使用W3C Trace Context标准,通过兼容OpenTelemetry的traceparent头部进行追踪上下文的传播。
使用教程
1. 访问Arch的GitHub页面,了解项目详情和快速开始指南。
2. 阅读Arch的文档,了解如何部署和配置Arch网关。
3. 根据文档指导,将Arch集成到您的应用中,设置提示处理和LLMs调用。
4. 利用Arch的监控和追踪功能,优化应用性能和用户体验。
5. 通过Arch的前端网关功能,实现TLS终止和基于提示的路由。
6. 根据需要,配置Arch的流量管理功能,包括智能重试和灾难恢复。
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase