Digirl : 自律型強化学習を用いて、野外機器制御エージェントを訓練します。

Digirl

AI開発助手 AI強化学習 #強化学習 #自律学習 #機器制御 #Androidタスク通常製品オープンソース

紹介 :

DigiRLは、野外環境で機器を制御できるインテリジェントエージェントをトレーニングするための革新的なオンライン強化学習アルゴリズムです。自律的価値評価モデル（VLM）を用いて、オープンエンドな現実世界のAndroidタスクを解決します。DigiRLの主な利点としては、既存の非最適オフラインデータセットを活用できること、オフラインからオンラインへの強化学習により、エージェント自身の試行錯誤からの学習を促進できることが挙げられます。このモデルは、命令レベルの価値関数を使用して自動カリキュラムを暗黙的に構築し、エージェントにとって最も価値のあるタスクを優先し、ステップレベルの価値関数を使用して、軌跡の中で目標に貢献する有利な行動を選択します。

ターゲットユーザー :

DigiRLのターゲットユーザーは、主に人工知能と機械学習分野の研究者と開発者、特に強化学習、自律型インテリジェントエージェント、および機器制御の自動化に特化した専門家です。彼らはDigiRLを利用して、変化する環境に適応できるインテリジェントシステムを開発し、自動化タスクの効率性と正確性を向上させることができます。

総訪問数： 0

最も高い割合の地域： US(81.52%)

ウェブサイト閲覧数： 49.1K

使用シナリオ

良いイタリアンレストランを検索する場合、DigiRLは自動的に検索タスクを実行できます。

NeweggでAlienware Auroraを検索する場合、DigiRLは自動的に製品ページに移動して検索を実行できます。

トレーニング中、DigiRLは自律的なデータ更新によって安定したパフォーマンスを維持し、ウェブサイトが変化しても効率性を維持できます。

製品特徴

自律型VLM評価器を用いて、オープンエンドなAndroidタスクを解決する

オフライン強化学習により、既存データセットの活用を最大化する

オフラインからオンラインへの強化学習により、エージェントの自己学習を促進する

命令レベルの価値関数を使用して自動カリキュラムを構築する