
使用場景
法律團隊使用VARAG快速檢索合同文檔中的相關條款。
研究人員利用VARAG從大量學術論文中提取關鍵信息。
商業分析師使用VARAG分析市場報告中的圖表和數據。
產品特色
支持多種檢索技術,包括文本、圖像和多模態文檔檢索。
Simple RAG:通過OCR技術提取文檔中的文本並進行檢索。
Vision RAG:結合視覺信息進行檢索,使用JinaCLIP模型進行跨模態編碼。
ColPali RAG:直接將文檔頁面作為圖像嵌入,使用PaliGemma模型進行編碼。
Hybrid ColPali RAG:結合圖像嵌入和ColPali的晚期交互機制進行檢索。
提供交互式遊樂場,可以比較不同的RAG解決方案。
支持本地運行和Google Colab上的演示。
使用教程
克隆倉庫:使用git命令克隆VARAG的GitHub倉庫。
設置環境:使用Conda創建並激活虛擬環境。
安裝依賴:使用pip或poetry安裝所需的Python包。
運行演示:執行demo.py腳本,通過--share參數在本地或Google Colab上運行。
索引數據源:使用VARAG提供的類和方法對數據源進行索引。
執行搜索:輸入查詢並執行搜索,獲取檢索結果。
使用結果:將檢索結果用於進一步的分析或生成響應。