

Goedel Prover
简介 :
Goedel-Prover 是一款专注于自动化定理证明的开源大型语言模型。它通过将自然语言数学问题翻译为形式化语言(如 Lean 4),并生成形式化证明,显著提升了数学问题的自动化证明效率。该模型在 miniF2F 基准测试中达到了 57.6% 的成功率,超越了其他开源模型。其主要优点包括高性能、开源可扩展性以及对数学问题的深度理解能力。Goedel-Prover 旨在推动自动化定理证明技术的发展,并为数学研究和教育提供强大的工具支持。
需求人群 :
Goedel-Prover 适合数学家、计算机科学家、研究人员以及对自动化定理证明感兴趣的开发者。它为数学研究、教育和相关领域的自动化证明提供了强大的技术支持。
使用场景
在 miniF2F 基准测试中,Goedel-Prover 达到了 57.6% 的成功率,显著高于其他开源模型。
在 PutnamBench 排行榜中,Goedel-Prover 成功解决了 7 个问题,位居榜首。
为 Lean Workbook 生成了 29.7K 个形式化证明,几乎翻倍于此前的工作成果。
产品特色
将自然语言数学问题翻译为形式化语言(Lean 4)
生成高质量的形式化证明
支持多数据集的性能评估
提供开源模型和数据集,便于研究和扩展
在多个基准测试中表现优异,如 miniF2F 和 PutnamBench
支持多 GPU 并行推理,提升计算效率
使用教程
1. 克隆仓库:`git clone --recurse-submodules https://github.com/Goedel-LM/Goedel-Prover.git`
2. 安装依赖:`pip install -r requirements.txt`
3. 构建 Lean 4 和 mathlib4:`cd mathlib4 && lake build`
4. 测试安装:运行 `python prover/lean/verifier.py` 确保环境正常
5. 运行推理:使用 `sh eval/eval.sh` 脚本,指定数据集、模型路径和输出目录等参数
精选AI产品推荐

Elicit
Elicit是一款能够以超人速度分析研究论文的AI助手。它可以自动完成繁琐的研究任务,如论文摘要、数据提取和综合研究发现。用户可以搜索相关论文、获取一句话摘要、从论文中提取详细信息并进行整理、寻找主题和概念等。Elicit的准确度高,使用方便,已受到广大研究者的信赖和好评。
研究工具
627.6K
中文精选

Findin AI
Findin AI 是一款旨在通过人工智能技术全面提速学术研究工作流的工具。它通过文献筛选、论文阅读、笔记摘录、主题研究、文献综述和学术写作等功能,帮助用户高效管理文献和知识,提升研究效率。产品利用AI技术,如自动总结、一键获取参考文献、文献问答等,大幅减少研究过程中的重复劳动,使研究者能够专注于创新和深度思考。
研究工具
300.3K