
Helpful DoggyBot
Helpful DoggyBot是一個四足機器人室內移動操作系統,它通過前端夾持裝置進行物體操作,使用在模擬環境中訓練的低級控制器實現敏捷技能,如攀爬和全身傾斜。此外,它還結合了預訓練的視覺-語言模型(VLMs)進行語義理解和命令生成。該系統在沒有實際數據收集或訓練的情況下,能在未見過的環境中零樣本泛化完成任務,如按照用戶的指令在攀爬過後的床邊取回隨機放置的玩具,成功率達到60%。
AI機器人
45.3K
國外精選

NEO
NEO是1X Technologies公司開發的一款家用智能人形機器人,它通過模擬學習,能夠理解自然語言和物理空間,執行實際任務。NEO基於EVE機器人的現實世界經驗,通過1X Studio的遠程操作訓練,能夠智能地完成任務。NEO的主要優點包括安全性、智能性和可擴展性,旨在為家庭提供幫助,同時保持安全和高效。
AI機器人
50.2K

Maniwav
ManiWAV是一個研究項目,旨在通過野外的音頻和視覺數據學習機器人操控技能。它通過收集人類演示的同步音頻和視覺反饋,並通過相應的策略接口直接從演示中學習機器人操控策略。該模型展示了通過四個接觸豐富的操控任務來證明其系統的能力,這些任務需要機器人被動地感知接觸事件和模式,或主動地感知物體表面的材料和狀態。此外,該系統還能夠通過學習多樣化的野外人類演示來泛化到未見過的野外環境中。
AI機器人
48.0K

Humanplus
HumanPlus是一個研究項目,旨在通過模仿人類動作來訓練人形機器人,從而實現自主技能學習。該項目通過模擬強化學習訓練低級策略,並將這些策略應用到真實世界中,實現即時跟蹤人類身體和手部動作。通過影子模仿技術,操作員可以遠程操作機器人收集全身數據,用於學習不同任務。此外,通過行為克隆技術,機器人能夠模仿人類技能,完成各種任務。
AI機器人
53.8K

Cyberdemo
CyberDemo是一個旨在通過模擬人類演示來增強現實世界中靈巧操作的項目。它可能涉及到機器人技術、機器學習和模擬環境的結合,以提高機器人在複雜環境中的操作能力。
AI機器人
60.4K

Universal Manipulation Interface
通用操作接口(UMI)是一個數據收集和策略學習框架,允許直接將現場人類演示中的技能轉移到可部署的機器人策略。UMI採用手持夾具與仔細的界面設計相結合,實現便攜、低成本和信息豐富的數據收集,用於挑戰性的雙手和動態操作演示。為促進可部署的策略學習,UMI結合了精心設計的策略界面,具有推理時延遲匹配和相對軌跡動作表示。從而產生的學習策略與硬件無關,並且可以在多個機器人平臺上部署。配備這些功能,UMI框架解鎖了新的機器人操作功能,僅通過為每個任務更改訓練數據,允許泛化的動態、雙手、精確和長時間的行為,從而實現零次調整。我們通過全面的真實環境實驗演示了UMI的通用性和有效性,其中僅通過使用各種人類演示進行訓練的UMI策略,在面對新環境和對象時實現了零次調整的泛化。
AI機器人
99.9K

Alter3
Alter3是一個基於GPT-4的擬人機器人,能夠通過自然語言指令生成各種人類動作,實現零次學習。它具有43個關節自由度,可以自由運動,同時結合面部表情識別和生成,實現複雜的交互。用戶只需要提供語言指令,Alter3就可以自主調整代碼,生成相應運動,無需人工迭代調整。還可以通過語言反饋來優化動作,形成運動記憶。這種結合語言理解和身體運動的系統,大大提升了人機交互的潛力。
AI機器人
55.2K

RT Trajectory
RT-Trajectory 是一種基於粗糙軌跡草圖的機器人控制策略,通過軌跡草圖實現對新任務的有效泛化能力。它既可以通過人工繪製、視頻演示等方式生成軌跡草圖,也可以通過圖像生成模型等方式生成軌跡草圖。RT-Trajectory 在各種真實世界機器人任務中得到了廣泛評估,相比於基於語言和目標的策略,具有更廣泛的任務執行能力。
AI機器人
55.5K
精選AI產品推薦
中文精選

騰訊混元圖像 2.0
騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型,顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構,使得圖像生成速度可達到毫秒級,避免了傳統生成的等待時間。同時,模型通過強化學習算法與人類美學知識的結合,提升了圖像的真實感和細節表現,適合設計師、創作者等專業用戶使用。
圖片生成
80.9K
國外精選

Lovart
Lovart 是一款革命性的 AI 設計代理,能夠將創意提示轉化為藝術作品,支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程,節省時間並提升創意靈感。Lovart 當前處於測試階段,用戶可加入等候名單,隨時體驗設計的樂趣。
AI設計工具
64.0K

Fastvlm
FastVLM 是一種高效的視覺編碼模型,專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器,減少了高分辨率圖像的編碼時間和輸出的 token 數量,使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力,適用於各種應用場景,尤其在需要快速響應的移動設備上表現優異。
AI模型
51.1K

Keysync
KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題,同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果,適用於自動配音等實際應用場景。
視頻編輯
48.6K

Manus
Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品,能夠直接交付完整的任務成果,而不僅僅是提供建議或答案。它採用 Multiple Agent 架構,運行在獨立虛擬機中,能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現,展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’,幫助用戶高效完成各種複雜任務。
個人助理
1.5M

Trae國內版
Trae是一款專為中文開發場景設計的AI原生IDE,將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能,顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白,滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具,旨在為專業開發者提供強大的技術支持,目前尚未明確公開價格,但預計會採用付費模式以匹配其高端定位。
開發與工具
138.0K
國外精選

Pika
Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。
視頻生成
18.7M
中文精選

Liblibai
LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。
AI模型
8.0M