aimo-progress-prize
A
Aimo Progress Prize
紹介 :
このGitHubリポジトリには、AI数学オリンピック(AIMO)進歩賞で受賞したソリューションを再現するための、トレーニングと推論コードが含まれています。私たちのソリューションは、主に4つの部分で構成されています。ツール統合推論(TIR)を使用して数学の問題を解くためにDeepSeekMath-Base 7Bをファインチューニングするためのレシピ、約100万個の数学の問題と解答からなる2つの高品質なトレーニングデータセット、コード実行フィードバック付きの解答候補を生成するための自己無撞着デコーディングアルゴリズム(SC-TIR)、そしてモデル選択をガイドし、公開ランキングへの過剰適合を回避するための、AMC、AIME、MATHから厳選された4つの検証セットです。
ターゲットユーザー :
この製品は、数学およびコンピュータサイエンス分野の研究者や学生、特にAIによる複雑な数学問題解決への応用に関心のある方々に適しています。深層学習モデルを使用して数学問題解決能力を向上させる方法を理解するのに役立ちます。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 53.8K
使用シナリオ
研究者はこのモデルを使用して、数学コンテストの問題解決能力を向上させます。
学生はこのモデルを利用して、複雑な数学的概念を学習し理解します。
教育者はこのモデルを教育補助ツールとして使用し、学生が数学の問題解決スキルを習得するのを支援します。
製品特徴
数学問題を解くためのDeepSeekMath-Base 7Bモデルのファインチューニング
2つの高品質な数学の問題と解答のデータセットを使用したトレーニング
自己無撞着デコーディングアルゴリズムによる解答候補の生成
AMC、AIME、MATHからの検証セットを使用したモデル選択のガイド
オープンソースライブラリTRL、PyTorch、vLLM、DeepSpeedを使用したモデルのトレーニング
モデルトレーニングはCoTトレーニングとTIRトレーニングの2段階で行われます
使用チュートリアル
1. Python仮想環境を作成してアクティブにします。
2. 再現性を確保するために特定バージョンのPyTorchをインストールします。
3. その他必要なパッケージ依存関係をインストールします。
4. Flash Attention 2をインストールします。
5. Hugging Faceアカウントにログインします。
6. モデルをHugging Face HubにプッシュするためにGit LFSをインストールします。
7. MuMath-Codeレシピに従って、CoTトレーニングとTIRトレーニングの2段階トレーニングを行います。
8. トレーニング完了後、AutoGPTQを使用してモデルを8ビット量子化します(オプション)。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase