

Eureka
紹介 :
Eurekaは、大規模言語モデルを用いて実装された人間レベルの報酬設計アルゴリズムです。 GPT-4などの最先端言語モデルのゼロショット生成、コード記述、コンテキスト改良能力を活用し、報酬コードを進化的に最適化します。生成された報酬は、強化学習を通じて複雑なスキルを獲得するために使用できます。Eurekaが生成した報酬関数は、10種類の異なるロボット形態を含む29種類のオープンソース強化学習環境において、人間が設計した報酬関数よりも優れた性能を示しました。また、Eurekaは報酬関数を柔軟に改良し、生成される報酬の質と安全性を向上させることができます。コース学習と組み合わせることで、Eurekaの報酬関数を使用し、シミュレーションされたShadow Handによる回転ペンのスキルを初めて実現し、円の中を素早く巧みにペンを操作することに成功しました。
ターゲットユーザー :
報酬設計と強化学習が必要なタスクに適用可能
製品特徴
大規模言語モデルによる報酬設計
進化最適化による複雑な報酬関数の生成
生成された報酬関数による強化学習
おすすめAI製品

Openui
UIコンポーネントの構築は、多くの場合退屈な作業です。OpenUIは、このプロセスを楽しく、迅速で、柔軟なものにすることを目指しています。これは、W&Bが次世代ツールのテストとプロトタイピングに使用しているツールであり、LLMを基盤とした強力なアプリケーションを構築するために使用されます。想像力でUIを記述し、リアルタイムでレンダリング結果を確認できます。変更を要求し、HTMLをReact、Svelte、Webコンポーネントなどに変換できます。V0のオープンソース版で、多少洗練されていないバージョンと考えてください。
AI開発助手
756.5K

Opendevin
OpenDevinは、複雑なエンジニアリングタスクを実行し、ソフトウェア開発プロジェクトにおいてユーザーと積極的に連携する自律型AIソフトウェアエンジニアであるDevinを複製、強化、そして革新することを目的としたオープンソースプロジェクトです。本プロジェクトはオープンソースコミュニティの力を活用し、Devinの能力を探求?拡張し、その強みと改善すべき点を特定することで、オープンソースコードモデルの進歩を導きます。
AI開発助手
599.2K