LongCite
L
Longcite
簡介 :
LongCite是一個開源的模型,它通過訓練大型語言模型(LLMs)來實現在長文本問答場景中生成準確的回答和精確的句級引用。該技術的重要性在於它能夠提高問答系統的準確性和可信度,使用戶能夠驗證輸出信息的來源。LongCite支持高達128K的上下文長度,並且提供了兩個模型:LongCite-glm4-9b和LongCite-llama3.1-8b,分別基於GLM-4-9B和Meta-Llama-3.1-8B進行訓練。
需求人群 :
LongCite的目標受眾主要是自然語言處理領域的研究人員和開發者,特別是那些需要在長文本環境中進行問答系統開發和優化的專業人士。該技術能夠幫助他們提高系統的準確性和用戶的信任度。
總訪問量: 474.6M
佔比最多地區: US(19.34%)
本站瀏覽量 : 53.0K
使用場景
研究人員使用LongCite模型在學術論文中自動引用相關研究。
開發者將LongCite集成到問答系統中,提高系統的回答質量和可信度。
教育機構利用LongCite模型教授學生如何進行學術引用。
產品特色
支持長文本問答,生成準確的回答和精確的句級引用。
提供兩個訓練好的模型:LongCite-glm4-9b和LongCite-llama3.1-8b。
支持高達128K的上下文長度。
提供環境設置指南和模型部署方法。
提供CoF(Citation with Fine-grained Context)流水線。
提供模型訓練和評估的詳細指南。
提供自動基準測試:LongBench-Cite,用於衡量引用質量和回答正確性。
使用教程
1. 根據環境設置指南安裝必要的軟件和庫。
2. 使用提供的代碼示例下載並設置LongCite模型。
3. 準備長文本上下文和查詢。
4. 調用模型的query_longcite函數,傳入上下文和查詢。
5. 獲取模型生成的回答和引用。
6. 根據需要調整模型參數,如輸入長度和新令牌數量。
7. 部署模型到服務器或本地環境,以供實際應用。
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase