Llama 3 Patronus Lynx 8B Instruct V1.1 : 開源幻覺評估模型

模型訓練與部署

Llama 3 Patronus Lynx 8B Instruct V1.1

Llama-3-Patronus-Lynx-8B-Instruct-v1.1

Llama 3 Patronus Lynx 8B Instruct V1.1

模型訓練與部署研究工具 #文本生成 #幻覺評估 #對話系統 #自然語言處理普通產品開源

簡介 :

Patronus-Lynx-8B-Instruct-v1.1是基於meta-llama/Meta-Llama-3.1-8B-Instruct模型的微調版本，主要用於檢測RAG設置中的幻覺。該模型經過CovidQA、PubmedQA、DROP、RAGTruth等多個數據集的訓練，包含人工標註和合成數據。它能夠評估給定文檔、問題和答案是否忠實於文檔內容，不提供超出文檔範圍的新信息，也不與文檔信息相矛盾。

需求人群 :

目標受眾為研究人員、開發者和企業，他們需要一個可靠的模型來評估和生成忠實於源文檔的文本。該模型適合用於自然語言處理、文本摘要、問答系統和聊天機器人等應用場景。

總訪問量： 29.7M

佔比最多地區： US(17.94%)

本站瀏覽量： 46.1K

使用場景

研究人員使用該模型來評估醫學文獻中答案的準確性。

開發者將模型集成到問答系統中，提供基於文檔的準確回答。

企業使用模型檢測金融報告中的信息一致性。

產品特色

幻覺檢測：評估答案是否忠實於給定文檔。

文本生成：基於用戶輸入的問題和文檔生成答案。

聊天格式訓練：模型以聊天格式進行訓練，適合對話式應用。

多數據集訓練：包括CovidQA、PubmedQA、DROP、RAGTruth等。

長序列處理：支持最大128000個token的序列長度。

開源許可：遵循cc-by-nc-4.0許可，可自由使用和修改。

高性能：在多個基準測試中表現優異，如HaluEval、RAGTruth等。

使用教程

1. 準備問題、文檔和答案的輸入數據。

2. 使用模型推薦的prompt格式組織輸入數據。

3. 調用Hugging Face的pipeline接口，傳入模型名稱和配置參數。

4. 將準備好的數據作為用戶消息傳遞給pipeline。

5. 獲取模型輸出，包括'PASS'或'FAIL'的評分和推理。

6. 分析模型輸出，根據評分和推理判斷答案是否忠實於文檔。

7. 根據需要調整模型參數，優化性能。

精選AI產品推薦

Elicit

Elicit是一款能夠以超人速度分析研究論文的AI助手。它可以自動完成繁瑣的研究任務，如論文摘要、數據提取和綜合研究發現。用戶可以搜索相關論文、獲取一句話摘要、從論文中提取詳細信息並進行整理、尋找主題和概念等。Elicit的準確度高，使用方便，已受到廣大研究者的信賴和好評。

Findin AI

Findin AI 是一款旨在通過人工智能技術全面提速學術研究工作流的工具。它通過文獻篩選、論文閱讀、筆記摘錄、主題研究、文獻綜述和學術寫作等功能，幫助用戶高效管理文獻和知識，提升研究效率。產品利用AI技術，如自動總結、一鍵獲取參考文獻、文獻問答等，大幅減少研究過程中的重複勞動，使研究者能夠專注於創新和深度思考。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase