

Goedel Prover
簡介 :
Goedel-Prover 是一款專注於自動化定理證明的開源大型語言模型。它通過將自然語言數學問題翻譯為形式化語言(如 Lean 4),並生成形式化證明,顯著提升了數學問題的自動化證明效率。該模型在 miniF2F 基準測試中達到了 57.6% 的成功率,超越了其他開源模型。其主要優點包括高性能、開源可擴展性以及對數學問題的深度理解能力。Goedel-Prover 旨在推動自動化定理證明技術的發展,併為數學研究和教育提供強大的工具支持。
需求人群 :
Goedel-Prover 適合數學家、計算機科學家、研究人員以及對自動化定理證明感興趣的開發者。它為數學研究、教育和相關領域的自動化證明提供了強大的技術支持。
使用場景
在 miniF2F 基準測試中,Goedel-Prover 達到了 57.6% 的成功率,顯著高於其他開源模型。
在 PutnamBench 排行榜中,Goedel-Prover 成功解決了 7 個問題,位居榜首。
為 Lean Workbook 生成了 29.7K 個形式化證明,幾乎翻倍於此前的工作成果。
產品特色
將自然語言數學問題翻譯為形式化語言(Lean 4)
生成高質量的形式化證明
支持多數據集的性能評估
提供開源模型和數據集,便於研究和擴展
在多個基準測試中表現優異,如 miniF2F 和 PutnamBench
支持多 GPU 並行推理,提升計算效率
使用教程
1. 克隆倉庫:`git clone --recurse-submodules https://github.com/Goedel-LM/Goedel-Prover.git`
2. 安裝依賴:`pip install -r requirements.txt`
3. 構建 Lean 4 和 mathlib4:`cd mathlib4 && lake build`
4. 測試安裝:運行 `python prover/lean/verifier.py` 確保環境正常
5. 運行推理:使用 `sh eval/eval.sh` 腳本,指定數據集、模型路徑和輸出目錄等參數
精選AI產品推薦

Elicit
Elicit是一款能夠以超人速度分析研究論文的AI助手。它可以自動完成繁瑣的研究任務,如論文摘要、數據提取和綜合研究發現。用戶可以搜索相關論文、獲取一句話摘要、從論文中提取詳細信息並進行整理、尋找主題和概念等。Elicit的準確度高,使用方便,已受到廣大研究者的信賴和好評。
研究工具
625.1K
中文精選

Findin AI
Findin AI 是一款旨在通過人工智能技術全面提速學術研究工作流的工具。它通過文獻篩選、論文閱讀、筆記摘錄、主題研究、文獻綜述和學術寫作等功能,幫助用戶高效管理文獻和知識,提升研究效率。產品利用AI技術,如自動總結、一鍵獲取參考文獻、文獻問答等,大幅減少研究過程中的重複勞動,使研究者能夠專注於創新和深度思考。
研究工具
297.3K