一种带有实例分割的SLAM方法技术

技术编号：22418861 阅读：24 留言：0更新日期：2019-10-30 02:12

本发明专利技术公开了一种带有实例分割的SLAM方法。该方法利用一个彩色‑深度相机采集图像，利用ElasticFusion SLAM系统和实例分割网络Mask R‑CNN对采集的图像进行处理，在进行实时定位和地图重建的同时，在地图中加入实例信息。该方法突破了传统的SLAM系统只包含几何信息的局限，在原有基础上增加了更高维的实例信息，使得改进后的SLAM系统更加适用于人机交互领域。

全部详细技术资料下载

【技术实现步骤摘要】
一种带有实例分割的SLAM方法
本专利技术属于SLAM、深度学习、计算机视觉
，涉及一种带有实例分割的SLAM方法。
技术介绍
即时定位与地图构建(SLAM)技术在机器人领域占有举足轻重的地位，近年来，已经发展出了一些可实时运行的SLAM系统，ElasticFusion就是其中的典型代表。然而，传统的SLAM只包含点云的几何信息，包括点云的位置、法向量、颜色等，缺乏一些高层的表征方式。与此同时，随着深度学习的发展，以MaskR-CNN为代表的物体实例分割技术也达到了较高的识别精度，可以广泛应用于物体识别领域。因此，如何把实例分割技术融入到SLAM系统中成为一个难题，若能成功将诸如实例分割等高层信息于SLAM结合，将给予SLAM更强大的功能，有效扩大SLAM的应用领域。
技术实现思路
本专利技术的目的是针对现有技术的不足，提供一种带有实例分割的SLAM方法。本专利技术采用如下技术方案：一种带有实例分割的SLAM方法，该方法包括如下步骤：1.对ElasticFusionSLAM系统的数据结构进行扩充。ElasticFusion中地图的基础组成单位称为面元，对面元增加两个属性：①类别概率分布数组Class，Class是一个长度为N的数组；②实例概率分布数组Instance，Instance是一个长度为M的数组。增加一个计数器以记录地图中现有的实例个数。ElasticFusionSLAM系统开始运行时会首先构建一个不包含任何面元的空地图，并负责将实例个数设置为0。2.利用彩色-深度(RGB-D)摄像头获取一帧RGB-D图像Fk，输入到扩充后的SLAM系统中。其中...

【技术保护点】
1.一种带有实例分割的SLAM方法，其特征在于：所述方法包括以下步骤：(1)对ElasticFusion SLAM系统的数据结构进行扩充。ElasticFusion中地图的基础组成单位为面元，对面元增加两个属性：①类别概率分布数组Class，Class是一个长度为N的数组；②实例概率分布数组Instance，Instance是一个长度为M的数组。增加一个计数器以记录地图中现有的实例个数。ElasticFusion SLAM系统开始运行时会首先构建一个不包含任何面元的空地图，并负责将实例个数设置为0。(2)利用彩色‑深度(RGB‑D)摄像头获取一帧RGB‑D图像Fk，输入到扩充后的SLAM系统中。其中下标k代表当前帧的序号，初始帧的下标k＝1，此后每到来一帧，k依次累加。(3)利用ElasticFusion计算Fk对应的相机位姿TWC(k)，TWC(k)表示从相机坐标系到世界坐标系的齐次变换矩阵；同时可以得到从世界坐标系到相机坐标系的齐次变换矩阵

【技术特征摘要】
1.一种带有实例分割的SLAM方法，其特征在于：所述方法包括以下步骤：(1)对ElasticFusionSLAM系统的数据结构进行扩充。ElasticFusion中地图的基础组成单位为面元，对面元增加两个属性：①类别概率分布数组Class，Class是一个长度为N的数组；②实例概率分布数组Instance，Instance是一个长度为M的数组。增加一个计数器以记录地图中现有的实例个数。ElasticFusionSLAM系统开始运行时会首先构建一个不包含任何面元的空地图，并负责将实例个数设置为0。(2)利用彩色-深度(RGB-D)摄像头获取一帧RGB-D图像Fk，输入到扩充后的SLAM系统中。其中下标k代表当前帧的序号，初始帧的下标k＝1，此后每到来一帧，k依次累加。(3)利用ElasticFusion计算Fk对应的相机位姿TWC(k)，TWC(k)表示从相机坐标系到世界坐标系的齐次变换矩阵；同时可以得到从世界坐标系到相机坐标系的齐次变换矩阵使用TWC(k)和相机内参，对Fk中每个像素进行坐标变换并将其融合到三维地图中，融合方式分为两种：(3.1)若Fk中某一像素在三维地图中没有对应的面元，则在三维地图中增加一面元，其Class和Instance呈均匀分布；(3.2)若Fk中某一像素在三维地图中已存在对应的面元，则维持地图中对应面元的Class和Instance值不变。(4)将Fk输入到已经训练好的实例分割网络中，得到Fk对应的实例分割结果，其中包含Nins个实例其中，包含在同一个实例中的所有像素对应同一个长度为N的类别概率分布。(5)使用TCW(k)和相机内参，将地图中的面元投影到相机的像素平面上，得到投影帧Pk，每个实例内的像素的类别概率分布与Pk中对应像素...

【专利技术属性】
技术研发人员：孙东明，李华兵，杨恺伦，
申请(专利权)人：杭州凌像科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人