Longcite : 使大型語言模型在長文本問答中生成細粒度引用

Longcite

LongCite

Longcite

AI問答 AI模型 #長文本問答 #引用生成 #大型語言模型 #自然語言處理普通產品開源

簡介 :

LongCite是一個開源的模型，它通過訓練大型語言模型（LLMs）來實現在長文本問答場景中生成準確的回答和精確的句級引用。該技術的重要性在於它能夠提高問答系統的準確性和可信度，使用戶能夠驗證輸出信息的來源。LongCite支持高達128K的上下文長度，並且提供了兩個模型：LongCite-glm4-9b和LongCite-llama3.1-8b，分別基於GLM-4-9B和Meta-Llama-3.1-8B進行訓練。

需求人群 :

LongCite的目標受眾主要是自然語言處理領域的研究人員和開發者，特別是那些需要在長文本環境中進行問答系統開發和優化的專業人士。該技術能夠幫助他們提高系統的準確性和用戶的信任度。

總訪問量： 474.6M

佔比最多地區： US(19.34%)

本站瀏覽量： 53.0K

使用場景

研究人員使用LongCite模型在學術論文中自動引用相關研究。

開發者將LongCite集成到問答系統中，提高系統的回答質量和可信度。

教育機構利用LongCite模型教授學生如何進行學術引用。

產品特色

支持長文本問答，生成準確的回答和精確的句級引用。

提供兩個訓練好的模型：LongCite-glm4-9b和LongCite-llama3.1-8b。

支持高達128K的上下文長度。

提供環境設置指南和模型部署方法。

提供CoF（Citation with Fine-grained Context）流水線。

提供模型訓練和評估的詳細指南。

提供自動基準測試：LongBench-Cite，用於衡量引用質量和回答正確性。

使用教程

1. 根據環境設置指南安裝必要的軟件和庫。

2. 使用提供的代碼示例下載並設置LongCite模型。

3. 準備長文本上下文和查詢。

4. 調用模型的query_longcite函數，傳入上下文和查詢。

5. 獲取模型生成的回答和引用。

6. 根據需要調整模型參數，如輸入長度和新令牌數量。

7. 部署模型到服務器或本地環境，以供實際應用。

精選AI產品推薦

Deepmind Gemini

Deepmind Gemini

Gemini是谷歌DeepMind推出的新一代人工智能系統。它能夠進行多模態推理,支持文本、圖像、視頻、音頻和代碼之間的無縫交互。Gemini在語言理解、推理、數學、編程等多個領域都超越了之前的狀態,成為迄今為止最強大的AI系統之一。它有三個不同規模的版本,可滿足從邊緣計算到雲計算的各種需求。Gemini可以廣泛應用於創意設計、寫作輔助、問題解答、代碼生成等領域。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase