SpatialVLM
S
Spatialvlm
简介 :
SpatialVLM是一个由谷歌DeepMind开发的视觉语言模型,能够对空间关系进行理解和推理。它通过大规模合成数据的训练,获得了像人类一样直观地进行定量空间推理的能力。这不仅提高了其在空间VQA任务上的表现,还为链式空间推理和机器人控制等下游任务打开了新的可能。
需求人群 :
空间VQA、链式空间推理、机器人控制
总访问量: 2.9K
占比最多地区: US(52.64%)
本站浏览量 : 62.7K
使用场景
判断两个物体哪个离摄像头更近
估计两个物体之间的水平距离
判断桌子上是否形成等边三角形
产品特色
定性空间关系推理
定量距离和尺寸估计
支持链式多步空间推理
为机器人控制提供奖励
AIbase
智启未来,您的人工智能解决方案智库
© 2025AIbase