Archgw : 开源的GenAI应用网关，快速构建个性化的AI应用

Archgw

Archgw

Archgw

#开源 #GenAI #LLMs #Envoy #监控 #追踪 #网关优质新品商用

简介 :

Arch是一个开源的网关，专为处理提示（prompts）而设计，它利用快速的大型语言模型（LLMs）来处理提示，并与后端系统无缝集成。Arch基于Envoy构建，支持任何应用程序语言，并提供快速部署和透明升级。它提供了包括流量管理、前端/边缘网关、监控和端到端追踪在内的多种功能，帮助开发者构建快速、健壮和个性化的GenAI应用。

需求人群 :

目标受众为开发者和企业，特别是那些需要构建和部署基于提示的GenAI应用的团队。Arch提供了一个强大的平台，使得开发者能够快速集成LLMs，优化用户体验，并提高应用的可观测性和可靠性。

总访问量： 146

占比最多地区： US(100.00%)

本站浏览量： 51.1K

使用场景

使用Arch构建一个个性化的聊天机器人，通过用户提示调用后端API进行个性化响应。

利用Arch的流量管理功能，实现LLMs的智能重试和灾难恢复，保证AI应用的高可用性。

通过Arch的前端网关功能，实现TLS终止和基于提示的路由，提高AI应用的安全性和效率。

产品特色

基于Envoy的进程外架构：Arch依赖于Envoy，是一个自包含的过程，设计为与您的应用服务器一起运行。

与快速LLMs集成：Arch使用专为快速、成本效益高和准确处理提示而设计的专门（亚十亿）LLMs。

流量管理：提供LLM调用的多种能力，包括智能重试和自动切换到其他LLMs以保证连续可用性和灾难恢复。

前端/边缘网关：Arch非常适合作为AI应用的边缘网关，包括TLS终止、速率限制和基于提示的路由。

最佳监控：提供多个监控指标，帮助您了解应用的延迟、令牌使用情况和上游LLM提供商的错误率。

端到端追踪：Arch使用W3C Trace Context标准，通过兼容OpenTelemetry的traceparent头部进行追踪上下文的传播。

使用教程

1. 访问Arch的GitHub页面，了解项目详情和快速开始指南。

2. 阅读Arch的文档，了解如何部署和配置Arch网关。

3. 根据文档指导，将Arch集成到您的应用中，设置提示处理和LLMs调用。

4. 利用Arch的监控和追踪功能，优化应用性能和用户体验。

5. 通过Arch的前端网关功能，实现TLS终止和基于提示的路由。

6. 根据需要，配置Arch的流量管理功能，包括智能重试和灾难恢复。

精选AI产品推荐

抖音即创

即创工作台是一个一站式的智能创意生产与管理平台。它集成了视频创作、图文创作、直播创作等多种创意工具,可以通过AI的力量大大提高创作效率。主要功能和优势包括:1)视频创作:内置多种AI视频创作工具,支持智能编剧、数字人物、一键成片等,可快速生成高质量视频内容;2)图文创作:提供智能图文和商品图片生成工具,可快速制作微信文章、产品详情等图文内容;3)直播创作:支持AI直播背景、直播文案等创作工具,可轻松制作抖音、快手等直播内容。定位为新创和创意从业者的创意助手,以合理价格提供创意生产全流程服务。

Pika

Pika是一个视频制作平台,用户可以上传自己的创意想法,Pika会自动生成相关的视频。主要功能有:支持多种创意想法转视频,视频效果专业,操作简单易用。平台采用免费试用模式,定位面向创意者和视频爱好者。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase