Robotics Diffusion Transformer
R
Robotics Diffusion Transformer
紹介 :
RDT-1Bは、パラメータ数10億(現時点での最大規模)の模倣学習拡散トランスフォーマーであり、100万件以上(現時点での最大規模)の多様なロボットエピソードで事前学習されています。言語指示と最大3つのビューのRGB画像が与えられると、RDTはその後64個のロボット動作を予測できます。RDTは、片腕から両腕、関節からエンドエフェクタ、位置から速度、さらには車輪式移動まで、ほぼ全ての現代的な移動操作デバイスと互換性があります。このモデルは、6,000件以上(最大規模の1つ)の独自収集された両腕エピソードで微調整され、ALOHA双腕ロボットに導入されています。器用さ、ゼロショット汎化能力、少サンプル学習において最先端の性能を達成しています。
ターゲットユーザー :
ロボティクス、人工知能、機械学習分野の研究者や開発者を対象としています。RDT-1Bモデルは、多様なロボット学習、模倣学習、双腕操作タスクへの応用において、複雑な環境下での精密な操作や、言語指示からのタスク実行の学習が必要な研究者や開発者にとって特に適しています。
総訪問数: 502.6M
最も高い割合の地域: US(19.34%)
ウェブサイト閲覧数 : 49.4K
使用シナリオ
研究者はRDT-1Bモデルをカスタムデータセットで微調整し、特定の操作タスクに適合させます。
開発者は微調整済みのモデルを実ロボットプラットフォームに導入し、自動操作を実現します。
教育者はこのモデルを利用して、学生に深層学習技術による複雑なロボット操作タスクの実現方法を示します。
製品特徴
モデル実装:RDTのモデル実装コードを提供します。
事前学習済みモデルウェイト:多様なロボットデータで事前学習された100万ステップのRDT-1Bモデルウェイトを提供します。
訓練とサンプリングスクリプト:DeepSpeed対応の訓練とサンプリングスクリプトを提供します。
実ロボット導入例:実ロボット導入のサンプルコードを提供します。
使用チュートリアル
1. コードリポジトリをクローンして、前提条件をインストールします。
2. 多モーダルエンコーダをダウンロードしてリンクします。
3. 必要に応じて設定ファイルを変更します。
4. データセットを準備し、データセットローダーを実装します。
5. データセットの統計情報を計算します。
6. モデルの微調整を開始します。
7. 微調整後、モデルを実ロボットに導入します。
おすすめAI製品
DeepMind Gemini
Deepmind Gemini
Geminiは、Google DeepMindが開発した次世代人工知能システムです。テキスト、画像、ビデオ、音声、コード間のシームレスな相互作用をサポートし、マルチモーダル推論を実行できます。言語理解、推論、数学、プログラミングなど、複数の分野において従来のシステムを凌駕し、現在までに開発された最も強力なAIシステムの一つとなっています。エッジコンピューティングからクラウドコンピューティングまで、様々なニーズに対応できる3つの異なる規模のバージョンがあります。Geminiは、クリエイティブデザイン、ライティングアシスタント、質問応答、コード生成など、幅広い分野で活用できます。
AIモデル
11.4M
中国語精選
LiblibAI
Liblibai
LiblibAIは、中国をリードするAI創作プラットフォームです。強力なAI創作能力を提供し、クリエイターの創造性を支援します。プラットフォームは膨大な数の無料AI創作モデルを提供しており、ユーザーは検索してモデルを使用し、画像、テキスト、音声などの創作を行うことができます。また、ユーザーによる独自のAIモデルのトレーニングもサポートしています。幅広いクリエイターユーザーを対象としたプラットフォームとして、創作の機会を平等に提供し、クリエイティブ産業に貢献することで、誰もが創作の喜びを享受できるようにすることを目指しています。
AIモデル
6.9M
AIbase
未来を切り開く、あなたのAIソリューション知識ベース
© 2025AIbase