LEO
L
LEO
簡介 :
LEO是一個基於大型語言模型的多模態、多任務全能代理人,能夠在3D世界中感知、定位、推理、規劃和執行任務。LEO通過兩個階段的訓練實現:(i)3D視覺語言對齊和(ii)3D視覺語言動作指令調整。我們精心策劃和生成了一個包含物體級和場景級多模態任務的大規模數據集,需要對3D世界進行深入的理解和交互。通過嚴格的實驗,我們展示了LEO在3D字幕、問答、推理、導航和機器人操作等廣泛任務中的出色表現。
需求人群 :
LEO可用於在3D世界中完成多種任務,包括3D字幕、問答、推理、導航和機器人操作等。
總訪問量: 19
佔比最多地區: US(100.00%)
本站瀏覽量 : 42.0K
產品特色
3D視覺語言對齊
3D視覺語言動作指令調整
3D字幕
問答
推理
導航
機器人操作
AIbase
智啟未來,您的人工智能解決方案智庫
© 2025AIbase