基于视觉融合地标的拓扑地图生成方法技术

技术编号：24332413 阅读：95 留言：0更新日期：2020-05-29 20:19

本发明专利技术公开基于视觉融合地标的拓扑地图生成方法，包括：输入RGB图像，基于卷积神经网络对RGB图像进行语义分割，根据语义分割中间层的特征图提取出输出值大于预定值的点作为特征点；获取场景的深度图，基于深度图的深度信息和特征点在图像上的二维坐标信息，依据相机模型获取特征点的三维坐标和机器人的位姿信息以建立场景的三维地图，对输入图像进行基于深度学习的纹理分割，获取每个像素点在纹理特征空间下的编码；采用基于模糊数学地标级数据融合方法，获得点云相对于预定地标的隶属度分布函数，根据语义隶属度分布函数和三维地图，获得融合地标的三维语义地图；基于融合地标的三维语义地图构建拓扑地图生成融合地标的语义拓扑地图。

Topological map generation method based on visual fusion landmark

全部详细技术资料下载

【技术实现步骤摘要】
基于视觉融合地标的拓扑地图生成方法
本专利技术属于机器人
，特别是一种基于视觉融合地标的拓扑地图生成方法。
技术介绍
建图技术对于智能机器人探索任务环境、自主完成各种任务来说至关重要。智能机器人在运动过程中，通过传感器收集环境信息，分析数据，感知环境，有助于根据任务的需要以及环境的当前状态自主地做出相应的决策，进而完成各项任务，实现真正意义上的智能。在机器人领域，SLAM(同时定位与构图)技术是机器人构建地图、感知环境的一项关键技术。机器人在行进过程中通过激光雷达、相机等传感器数据，估计此时的位置和姿态，同时构建环境的地图。SLAM技术按照系统所采用的传感器大致可以分为两种，一种是使用激光雷达的SLAM技术，另一种是使用相机的视觉SLAM技术。其中，视觉SLAM技术通常又分为特征点法和直接法两种。传统的SLAM技术无论以激光雷达信息还是视觉图像信息作为系统输入，最终构建出的三维地图都只包含周围环境的几何信息，缺少语义信息。这给智能机器人根据任务自主进行推理，以及进一步实现复杂的人机交互带来了困难。带有语义的SLAM(简称语义SLAM)技术主要涉及传统的SLAM技术和语义分割技术。当前，关于语义SLAM的研究主要聚焦于应用于室内场景的基于激光雷达的SLAM。尽管激光雷达适合室外场景，但是相比于相机，其成本更加昂贵，并且获取的信息远少于视觉包含的信息。而基于视觉的语义SLAM主要是通过RGBD相机实现，即使融入了图像的语义分割结果，但是一方面系统仍然依赖于像素级的数据，易受光照等条件的影响，另一方面...

【技术保护点】
1.一种基于视觉融合地标的拓扑地图生成方法，所述方法包括以下步骤：/n第一步骤(S1)中，输入RGB图像，基于卷积神经网络对所述RGB图像进行语义分割，并根据语义分割中间层的特征图提取出大于预定值的输出值的点作为特征点；/n第二步骤(S2)中，获取场景的深度图，基于所述深度图的深度信息和所述特征点在图像上的坐标信息，依据相机模型获取所述特征点的三维坐标和机器人的位姿信息以建立场景的三维地图，其中，三维地图以点云的形式存储，每个点云根据语义分割的结果进行了筛选与标注；/n第三步骤(S3)中，对输入图像进行基于深度学习的纹理分割，获取每个像素点在纹理特征空间下的编码；/n第四步骤(S4)中，根据电子地图，获取环境中的建筑物的GPS信息和机器人的初始GPS信息，根据机器人初始GPS信息和所述位姿信息计算得到机器人在不同位姿下的GPS信息和三维地图中的点云的GPS信息；/n第五步骤(S5)中，根据所述点云的GPS信息和所述建筑物的坐标GPS信息及其编码，采用基于模糊数学的地标级数据融合方法，获得点云相对于预定地标的隶属度分布函数，根据语义隶属度分布函数和所述三维点云地图，获得融合了地标的三维语...

【技术特征摘要】
1.一种基于视觉融合地标的拓扑地图生成方法，所述方法包括以下步骤：
第一步骤(S1)中，输入RGB图像，基于卷积神经网络对所述RGB图像进行语义分割，并根据语义分割中间层的特征图提取出大于预定值的输出值的点作为特征点；
第二步骤(S2)中，获取场景的深度图，基于所述深度图的深度信息和所述特征点在图像上的坐标信息，依据相机模型获取所述特征点的三维坐标和机器人的位姿信息以建立场景的三维地图，其中，三维地图以点云的形式存储，每个点云根据语义分割的结果进行了筛选与标注；
第三步骤(S3)中，对输入图像进行基于深度学习的纹理分割，获取每个像素点在纹理特征空间下的编码；
第四步骤(S4)中，根据电子地图，获取环境中的建筑物的GPS信息和机器人的初始GPS信息，根据机器人初始GPS信息和所述位姿信息计算得到机器人在不同位姿下的GPS信息和三维地图中的点云的GPS信息；
第五步骤(S5)中，根据所述点云的GPS信息和所述建筑物的坐标GPS信息及其编码，采用基于模糊数学的地标级数据融合方法，获得点云相对于预定地标的隶属度分布函数，根据语义隶属度分布函数和所述三维点云地图，获得融合了地标的三维语义地图；
第六步骤(S6)中，基于融合地标的三维语义地图构建拓扑地图生成融合地标的语义拓扑地图。

2.根据权利要求1所述的方法，其中，优选的，第二步骤(S2)中，通过深度预测神经网络获得所述特征点的深度信息，将图像中二维特征点从相机坐标系转换到三维点云坐标系，获得该特征点在三维空间中的对应的点云。

3.根据权利要求2所述的方法，其中，坐标系转换过程为：

其中，(xv，yv，zv)表示点云的坐标值，Tpointcloud2camera表示从三维点云坐标系到相机坐标系的转换过程，(uc，vc)表示该点云对应的像素坐标值，其中，u，v是图像中像素点的横纵坐标，w为与深度相关的比例参数。

4.根据权利要求2所述的方法，其中，深度信息包括真实世界三维点距离相机光心的垂直距离。

5.根据权利要求2所述的方法，其中，图像每个像素属于建筑物的概率的图像语义分割结果与点云中每个点关联，使用贝叶斯更新规则更新每个点云的语义标签的概率分布，其中，根据三维点云与二维特征点的对应关系，每个特征点的是否属于建筑物的分布如下式：Lv(xv，yv，zv)＝Is(uc，vc)，其中，Is(uc...

【专利技术属性】
技术研发人员：任鹏举，李创，丁焱，赵子瑞，毛艺钧，郑南宁，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人