Search-R1
S
Search R1
紹介 :
Search-R1は、推論を行い、検索エンジンを呼び出すことができる大規模言語モデル(LLM)をトレーニングすることを目的とした強化学習フレームワークです。veRLをベースに構築されており、様々な強化学習手法と異なるLLMアーキテクチャをサポートしており、ツール拡張推論の研究開発において、効率性と拡張性を備えています。
ターゲットユーザー :
研究者や開発者で、推論モデルを強化するための効率的なツールを必要とし、柔軟に検索エンジンを呼び出して情報を入手し、モデルの性能を向上させたいと考えている方に向いています。
総訪問数: 0
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 40.0K
使用シナリオ
Search-R1を使用して、複雑な質問に答え、検索エンジンを呼び出して最新の情報を取得するモデルをトレーニングします。
このフレームワークを利用して、多様な対話を行い、リアルタイムでデータ検索を行うインテリジェントな質問応答システムを開発します。
教育分野への応用として、検索エンジンとの連携により、学習アシスタントの知識範囲を拡大します。
製品特徴
PPO、GRPO、reinforceなど、様々な強化学習手法をサポートし、様々なトレーニングニーズに対応します。
Llama3、Qwen2.5など、様々な言語モデルと互換性があり、ユーザーは適切なベースモデルを選択できます。
ローカルのスパース/デンス検索エンジンとオンライン検索エンジンの両方が使用でき、様々なシナリオに柔軟に対応できます。
複数ノードでのトレーニングをサポートし、30B以上のLLMにも対応することで、トレーニング効率を向上させます。
オープンソースであるため、ツール拡張LLM推論の研究開発を促進します。
カスタムデータセットと検索エンジンの使用をサポートし、個々のニーズに対応します。
完全な実験ログを記録し、再現性と分析を容易にします。
便利なインストールと迅速な起動ガイドを提供し、使いやすさを向上させます。
使用チュートリアル
実行環境をインストールし、依存関係を準備します。
インデックスとコーパスをダウンロードします。
トレーニングデータセットを処理します。
ローカル検索サーバーを起動します。
強化学習トレーニングスクリプトを実行します。
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase