RAG

# RAG

Ducky

Ducky是一种全面管理的AI检索服务，专为那些需要快速准确结果的开发人员而设计。它支持语义搜索，包括检索增强生成（RAG），并且提供了简单明了的Python SDK，可以快速构建出色的搜索功能。

Contextual AI Reranker

Contextual AI Reranker

Contextual AI Reranker 是一款革命性的AI模型，专为解决企业级检索增强生成（RAG）系统中信息冲突和排序不准确的问题而设计。它能够根据用户提供的自然语言指令，对检索结果进行精准排序，确保最符合需求的信息优先展示。该产品基于先进的AI技术，经过行业标准BEIR基准测试和内部数据集验证，表现卓越。其主要优点包括高准确率、强大的指令遵循能力和灵活的定制化选项，适用于金融、技术、专业服务等多个领域。产品目前提供免费试用，并通过API形式接入，方便企业快速部署和使用。

wdoc

wdoc 是由 Olicorne（一名医学生）开发的 RAG 系统，旨在通过检索增强生成技术解决文档查询和总结问题。它支持多种文件类型（如 PDF、网页、YouTube 视频等），并结合多种语言模型提供高召回率和高特异性的查询结果。wdoc 的主要优点包括强大的多文件类型支持、高效的检索能力和灵活的扩展性。它适用于研究人员、学生和专业人士，帮助他们快速处理大量信息。wdoc 目前处于开发阶段，开发者欢迎用户反馈和功能请求，以不断完善产品。

Site RAG

Site RAG 是一款 Chrome 扩展程序，旨在通过自然语言处理技术帮助用户在浏览网页时快速获取问题答案。它支持将当前页面内容作为上下文进行查询，还能将整个网站内容索引到向量数据库中，以便后续进行检索增强生成（RAG）。该产品完全在本地浏览器运行，确保用户数据安全，同时支持连接本地运行的 Ollama 实例进行推理。它主要面向需要快速从网页内容中提取信息的用户，如开发者、研究人员和学生。目前该产品免费提供，适合希望在浏览网页时获得即时帮助的用户。

rag-chat-component

Rag Chat Component

该产品是一个React组件，专为RAG（检索增强生成）AI助手设计。它结合了Upstash Vector进行相似性搜索、Together AI作为LLM（大型语言模型）以及Vercel AI SDK用于流式响应。这种组件化设计使得开发者可以快速将RAG能力集成到Next.js应用中，极大地简化了开发流程，同时提供了高度的可定制性。其主要优点包括响应式设计、支持流式响应、持久化聊天历史以及支持暗黑/浅色模式等。该组件主要面向需要在Web应用中集成智能聊天功能的开发者，尤其是那些使用Next.js框架的团队。它通过简化集成过程，降低了开发成本，同时提供了强大的功能。

开发与工具

RAG-logger

RAG-logger是一个为检索增强生成(Retrieval-Augmented Generation, RAG)应用设计的开源日志工具。它是一个轻量级的、针对RAG特定日志需求的开源替代方案，专注于为RAG应用提供全面的日志记录功能，包括查询跟踪、检索结果记录、LLM交互记录以及逐步性能监控。它采用基于JSON的日志格式，支持每日日志组织、自动文件管理和元数据丰富化。RAG-logger以其开源、轻量级和专注于RAG应用的特性，为开发者提供了一个有效的工具来监控和分析RAG应用的性能。

开发与工具

Command R7B

Command R7B是Cohere公司推出的一款高性能、可扩展的大型语言模型（LLM），专为企业级应用设计。它在保持较小模型体积的同时，提供了一流的速度、效率和质量，能够在普通的GPU、边缘设备甚至CPU上部署，大幅降低了AI应用的生产部署成本。Command R7B在多语言支持、引用验证检索增强生成（RAG）、推理、工具使用和代理行为等方面表现出色，特别适合需要优化速度、成本性能和计算资源的企业使用案例。

E2M

E2M是一个Python库，能够解析并转换多种文件类型到Markdown格式。它采用了解析器-转换器架构，支持包括doc、docx、epub、html、htm、url、pdf、ppt、pptx、mp3和m4a等多种文件格式的转换。E2M项目的最终目标是为检索增强生成(RAG)和模型训练或微调提供高质量的数据。

开发与工具

vision-is-all-you-need

Vision Is All You Need

vision-is-all-you-need是一个展示Vision RAG (V-RAG)架构的演示项目。V-RAG架构使用视觉语言模型(VLM)直接将PDF文件页面（或其他文档）嵌入为向量，无需繁琐的分块处理。该技术的重要性在于它能够大幅提高文档检索的效率和准确性，特别是在处理大量数据时。产品背景信息显示，这是一个利用最新人工智能技术，提高文档处理能力的创新工具。目前，该项目是开源的，可以免费使用。

Minima

Minima是一个开源的、完全本地化的RAG（Retrieval-Augmented Generation）模型，具备与ChatGPT和MCP（Model Context Protocol）集成的能力。它支持三种模式：完全本地安装、通过ChatGPT查询本地文档以及使用Anthropic Claude查询本地文件。Minima的主要优点包括本地化处理数据，保护隐私，以及能够利用强大的语言模型来增强检索和生成任务。产品背景信息显示，Minima支持多种文件格式，并允许用户自定义配置以适应不同的使用场景。Minima是免费开源的，定位于需要本地化AI解决方案的开发者和企业。

开发与工具

Qwen-Agent

Qwen-Agent是一个基于Qwen>=2.0构建的Agent框架，它具备指令遵循、工具使用、规划和记忆能力。该框架提供了如浏览器助手、代码解释器和自定义助手等示例应用。Qwen-Agent的主要优点包括其高度的可扩展性和模块化设计，允许开发者根据需要集成不同的工具和功能。产品背景信息显示，Qwen-Agent旨在为开发者提供一个强大的工具集，以构建和部署基于大型语言模型的应用程序。Qwen-Agent在GitHub上开源，允许社区贡献和协作。

开发与工具

Inquir

Inquir是一个强大的工具，用于创建个性化的搜索引擎，根据您的数据量身定制。它解锁了诸如自定义搜索解决方案、数据组合、AI驱动的检索增强生成(RAG)系统以及上下文感知搜索功能等强大功能。通过启动您的引擎或安排演示，迈向改善用户体验的第一步。

Chonkie

Chonkie是一个为检索增强型生成（RAG）应用设计的文本分块库，它轻量级、快速，并且易于使用。该库提供了多种文本分块方法，支持多种分词器，并且具有高性能。Chonkie的主要优点包括丰富的功能、易用性、快速处理速度、广泛的支持和轻量级的设计。它适用于需要高效处理文本数据的开发者和研究人员，特别是在自然语言处理和机器学习领域。Chonkie是开源的，遵循MIT许可证，可以免费使用。

开发与工具

Trieve

Trieve是一个AI优先的基础设施API，结合了语言模型和工具，用于微调排名和相关性，提供一站式的搜索、推荐、RAG和分析解决方案。它能够自动持续改进，基于数十个反馈信号，确保相关性。Trieve支持语义向量搜索、BM25和SPlade全文搜索，以及混合搜索，结合全文搜索和语义向量搜索。此外，它还提供了商品推销和相关性调整功能，帮助用户通过API或无代码仪表板调整搜索结果以实现KPI。Trieve建立在最佳基础之上，使用开源嵌入模型和LLMs，运行在自己的服务器上，确保数据安全。

Dabarqus

Dabarqus是一个Retrieval Augmented Generation（RAG）框架，它允许用户将私有数据实时提供给大型语言模型（LLM）。这个工具通过提供REST API、SDKs和CLI工具，使得用户能够轻松地将各种数据源（如PDF、电子邮件和原始数据）存储到语义索引中，称为“记忆库”。Dabarqus支持LLM风格的提示，使用户能够以简单的方式与记忆库进行交互，而无需构建特殊的查询或学习新的查询语言。此外，Dabarqus还支持多语义索引（记忆库）的创建和使用，使得数据可以根据主题、类别或其他分组方式进行组织。Dabarqus的产品背景信息显示，它旨在简化私有数据与AI语言模型的集成过程，提高数据检索的效率和准确性。

开发与工具

Vectorize

Vectorize是一个专注于将非结构化数据转化为优化的向量搜索索引的平台，专为检索增强生成(RAG)而设计。它通过连接内容管理系统、文件系统、CRM、协作工具等多种数据源，帮助用户创建提高生产力的辅助系统和创新的客户体验。Vectorize的主要优点包括易于使用、快速部署和高精度的搜索结果，适合需要处理大量数据并希望快速实现AI应用的企业。

Epsilla

Epsilla是一个无需编码的RAG即服务(RAG-as-a-Service)平台，它允许用户基于私有或公共数据构建生产就绪的大型语言模型(Large Language Model, LLM)应用程序。该平台提供了一站式服务，包括数据管理、RAG工具、CI/CD风格的评估以及企业级安全措施，旨在降低总拥有成本(TCO)，提高查询速度和吞吐量，同时确保信息的时效性和安全性。

kotaemon

kotaemon是一个开源的、基于RAG（Retrieval-Augmented Generation）模型的工具，旨在通过聊天界面与用户文档进行交互。它支持多种语言模型API提供商和本地语言模型，提供了一个干净、可定制的用户界面，适用于终端用户进行文档问答以及开发者构建自己的RAG问答流程。

AI聊天机器人

Ragie

Ragie是一款面向开发者的RAG（Retrieval-Augmented Generation）即服务产品，它通过易于使用的API和SDK，帮助开发者快速启动并实现生成式AI应用。Ragie具备高级功能，如LLM重排、摘要索引、实体提取等，确保提供精确可靠的信息。它还支持与Google Drive、Notion等流行数据源的直接连接，并支持自动同步，保持数据最新。Ragie由Craft Ventures领导，提供简单明了的定价策略，无需设置费用或隐藏成本。

开发与工具

RAG_Techniques

RAG_Techniques 是一个专注于检索增强生成(Retrieval-Augmented Generation, RAG)系统的技术集合，旨在提升系统的准确性、效率和上下文丰富性。它提供了一个前沿技术的中心，通过社区贡献和协作环境，推动RAG技术的发展和创新。

Easy-RAG

Easy-RAG是一个检索增强生成(RAG)系统，它不仅适合学习者了解和掌握RAG技术，同时也便于开发者使用和进行自主扩展。该系统通过集成知识图谱提取解析工具、rerank重新排序机制以及faiss向量数据库等技术，提高了检索效率和生成质量。

RAGFoundry

RAGFoundry是一个库，旨在通过在特别创建的RAG增强数据集上微调模型，提高大型语言模型（LLMs）使用外部信息的能力。该库通过参数高效微调（PEFT）帮助用户轻松训练模型，并使用RAG特定指标衡量性能提升。它具有模块化设计，工作流程可通过配置文件自定义。

Korvus

Korvus是一个基于Postgres构建的搜索SDK，它将整个RAG（检索增强生成）流程统一到单一的数据库查询中。它提供了高性能、可定制的搜索能力，同时最小化了基础设施的考虑。Korvus利用PostgresML的pgml扩展和pgvector扩展，将RAG流程压缩在Postgres内部。它支持多语言SDK，包括Python、JavaScript、Rust和C，允许开发者无缝集成到现有的技术栈中。

Learn RAG with Langchain

Learn RAG With Langchain

Retrieval-Augmented Generation (RAG) 是一种前沿技术，通过整合外部知识源来增强生成模型的能力，提高生成内容的质量和可靠性。LangChain是一个强大的框架，专为构建和部署稳健的语言模型应用而设计。本教程系列将提供全面的、分步骤的指南，帮助您使用LangChain实现RAG，从基础RAG流程的介绍开始，逐步深入到查询转换、文档嵌入、路由机制、查询构建、索引策略、检索技术以及生成阶段，最终将所有概念整合到一个实际场景中，展示RAG的强大和灵活性。

开发与工具

RAGElo

RAGElo是一个工具集，使用Elo评分系统帮助选择最佳的基于检索增强生成（RAG）的大型语言模型（LLM）代理。随着生成性LLM在生产中的原型设计和整合变得更加容易，评估仍然是解决方案中最具有挑战性的部分。RAGElo通过比较不同RAG管道和提示对多个问题的答案，计算不同设置的排名，提供了一个良好的概览，了解哪些设置有效，哪些无效。

GoMate

GoMate是一个基于Retrieval-Augmented Generation (RAG)框架的模型，专注于提供可靠输入和可信输出。它通过结合检索和生成技术，提高信息检索和文本生成的准确性和可靠性。GoMate适用于需要高效、准确信息处理的领域，如自然语言处理、知识问答等。

Omakase RAG Orchestrator

Omakase RAG Orchestrator

Omakase RAG Orchestrator是一个旨在解决构建RAG应用时遇到的挑战的项目，它通过提供一个综合的Web应用程序和API来封装大型语言模型(LLMs)及其包装器。该项目整合了Django、Llamaindex和Google Drive，以提高应用的可用性、可扩展性和数据及用户访问管理。

Verba

Verba 是一个开源应用程序，旨在提供端到端、流畅且用户友好的检索增强生成（RAG）接口。它结合了最先进的RAG技术和Weaviate的上下文感知数据库，支持本地或通过云部署，可以轻松探索数据集并提取洞见。

Command R+

Command R+是一款先进的RAG优化模型，专为处理企业级工作负载而设计，首次在Microsoft Azure上推出。该模型具有128k令牌上下文窗口，提供最佳性能的先进检索增强生成（RAG）功能，支持10种关键语言的多语言覆盖，以及工具使用功能以自动化复杂的业务流程。定价为Command R+：$3.00/M输入令牌，$15.00/M输出令牌。该产品适用于各种企业场景，如金融、人力资源、销售、营销和客户支持等。

SciPhi

SciPhi是一个开源的端到端RAG平台，使构建、部署和优化系统变得简单。它提供直观的框架和抽象，可与LangChain等解决方案相比较。通过SciPhi，您可以轻松启动和扩展最好的RAG系统，并选择各种托管和远程提供商以满足您的需求。无论是自托管还是云部署选项都可用。

精选AI产品推荐

NoCode

NoCode 是一款无需编程经验的平台，允许用户通过自然语言描述创意并快速生成应用，旨在降低开发门槛，让更多人能实现他们的创意。该平台提供实时预览和一键部署功能，非常适合非技术背景的用户，帮助他们将想法转化为现实。

ListenHub

ListenHub 是一款轻量级的 AI 播客生成工具，支持中文和英语，基于前沿 AI 技术，能够快速生成用户感兴趣的播客内容。其主要优点包括自然对话和超真实人声效果，使得用户能够随时随地享受高品质的听觉体验。ListenHub 不仅提升了内容生成的速度，还兼容移动端，便于用户在不同场合使用。产品定位为高效的信息获取工具，适合广泛的听众需求。

Lovart

Lovart 是一款革命性的 AI 设计代理，能够将创意提示转化为艺术作品，支持从故事板到品牌视觉的多种设计需求。其重要性在于打破传统设计流程，节省时间并提升创意灵感。Lovart 当前处于测试阶段，用户可加入等候名单，随时体验设计的乐趣。

FastVLM

FastVLM 是一种高效的视觉编码模型，专为视觉语言模型设计。它通过创新的 FastViTHD 混合视觉编码器，减少了高分辨率图像的编码时间和输出的 token 数量，使得模型在速度和精度上表现出色。FastVLM 的主要定位是为开发者提供强大的视觉语言处理能力，适用于各种应用场景，尤其在需要快速响应的移动设备上表现优异。

Smart PDFs

Smart PDFs 是一个在线工具，利用 AI 技术快速分析 PDF 文档，并生成简明扼要的总结。它适合需要快速获取文档要点的用户，如学生、研究人员和商务人士。该工具使用 Llama 3.3 模型，支持多种语言，是提高工作效率的理想选择，完全免费使用。

KeySync

KeySync 是一个针对高分辨率视频的无泄漏唇同步框架。它解决了传统唇同步技术中的时间一致性问题，同时通过巧妙的遮罩策略处理表情泄漏和面部遮挡。KeySync 的优越性体现在其在唇重建和跨同步方面的先进成果，适用于自动配音等实际应用场景。

AnyVoice

AnyVoice是一款领先的AI声音生成器，采用先进的深度学习模型，将文本转换为与人类无法区分的自然语音。其主要优点包括超真实的声音效果、多语言支持、快速生成能力以及语音定制功能。该产品适用于多种场景，如内容创作、教育、商业和娱乐制作等，旨在为用户提供高效、便捷的语音生成解决方案。目前产品提供免费试用，适合不同层次的用户。

LiblibAI

LiblibAI是一个中国领先的AI创作平台,提供强大的AI创作能力,帮助创作者实现创意。平台提供海量免费AI创作模型,用户可以搜索使用模型进行图像、文字、音频等创作。平台还支持用户训练自己的AI模型。平台定位于广大创作者用户,致力于创造条件普惠,服务创意产业,让每个人都享有创作的乐趣。

AIbase

智启未来，您的人工智能解决方案智库

English 简体中文繁體中文にほんご

© 2025AIbase