

Korvus
簡介 :
Korvus是一個基於Postgres構建的搜索SDK,它將整個RAG(檢索增強生成)流程統一到單一的數據庫查詢中。它提供了高性能、可定製的搜索能力,同時最小化了基礎設施的考慮。Korvus利用PostgresML的pgml擴展和pgvector擴展,將RAG流程壓縮在Postgres內部。它支持多語言SDK,包括Python、JavaScript、Rust和C,允許開發者無縫集成到現有的技術棧中。
需求人群 :
Korvus的目標受眾是開發者和數據科學家,他們需要在數據庫層面上進行高效的RAG操作,同時希望簡化搜索架構並提高性能。Korvus的多語言支持和開源特性使其成為技術團隊的理想選擇,特別是那些已經在使用Postgres作為其數據存儲解決方案的團隊。
使用場景
使用Korvus進行大規模文本數據的快速檢索和生成。
集成到現有應用程序中,通過單一查詢實現複雜的文本處理和搜索功能。
在數據分析和機器學習項目中,使用Korvus進行高效的數據檢索和模型訓練。
產品特色
Postgres-Native RAG:直接在數據庫中執行復雜的RAG操作,無需外部服務和API調用。
Single Query Efficiency:整個RAG流程,從嵌入生成到文本生成,都在一個SQL查詢中執行。
Scalability and Performance:基於Postgres構建,繼承了其優秀的可擴展性和性能特性。
Simplified Architecture:用單一強大的查詢替代複雜的服務導向架構。
High Performance:消除API調用和數據移動,實現更快的處理和更高的可靠性。
Open Source:開源軟件和模型,提供本地Docker運行體驗。
Multi-Language Support:支持Python、JavaScript和Rust等多種編程語言。
Unified Pipeline:在一個查詢中結合嵌入生成、向量搜索、重排和文本生成。
使用教程
1. 設置Postgres數據庫,並安裝pgml和pgvector擴展。
2. 設置KORVUS_DATABASE_URL環境變量,指向你的數據庫連接字符串。
3. 初始化Collection和Pipeline,配置所需的文本處理和搜索模型。
4. 插入文檔到Collection中,為搜索和生成操作提供數據。
5. 執行RAG查詢,結合向量搜索和文本生成,獲取所需的結果。
6. 根據需要調整和優化查詢,利用Postgres的查詢優化能力。