ODIN Model : 单一模型实现2D和3D感知

ODIN Model

AI模型 AI图像检测识别 #计算机视觉 #实例分割 #3D感知 #转换器架构普通产品开源

简介 :

ODIN（Omni-Dimensional INstance segmentation）是一个模型，可以使用转换器架构在2D RGB图像和3D点云上进行分割和标记。它通过在2D视图内和3D视图之间交替融合信息来区分2D和3D特征操作。ODIN在ScanNet200、Matterport3D和AI2THOR 3D实例分割基准上实现了最先进的性能，并在ScanNet、S3DIS和COCO上实现了竞争性能。当使用来自3D网格的采样点云代替感知的3D点云时，它超过了以往所有的作品。作为可指导的具体化代理架构中的3D感知引擎时，它在TEACh对话动作基准上树立了新的最先进水平。我们的代码和检查点可以在项目网站找到。

需求人群 :

ODIN可用于计算机视觉、智能体架构、实例分割等领域。

总访问量： 29.7M

占比最多地区： US(17.94%)

本站浏览量： 48.0K

使用场景

使用ODIN模型进行3D实例分割

将ODIN应用于具体化代理架构的3D感知引擎

在计算机视觉研究中使用ODIN进行实验

产品特色

在2D RGB图像和3D点云上进行分割和标记

区分2D和3D特征操作