【技术实现步骤摘要】
一种三维语义地图的构建方法、装置、电子设备及存储介质
本申请涉及机器视觉
,特别涉及一种三维语义地图的构建方法、装置、电子设备及存储介质。
技术介绍
21世纪以来,人工智能在计算机领域受到了愈加广泛的重视,其理论和技术日益成熟,应用领域也不断扩大。机器人是人工智能技术的最直接、最普遍的应用,在未来将作为新型生产工具提高人类生产力并不断扩展人类活动领域。智能机器人能够像人类一样在现实场景中进行正确的动态决策与规划、行为控制、任务执行等活动,其基础和关键在于机器人对这个世界的正确感知。对于许多如营救被困人员或者在未知环境中寻找给定类型的目标等任务,不仅需要机器人自身定位以及感知周围环境几何信息,更需要机器人有能力了解场景及其内部包含对象的语义信息。举个例子,救援机器人应该能够识别场景中的障碍物和救援目标,并了解障碍物是墙壁、椅子、书架还是其他障碍物。因此,构建一个有语义标注的三维地图是任务型机器人正确感知三维场景的几何及语义信息,从而高效地完成相关任务的基础,是当前人工智能领域极具应用前景和社会价值的研究方向。机器人三维场景感知是指机器人能够依靠传感器获取周围环境的信息,并处理提取出环境中有效的三维几何或语义特征,最后表示成机器人能够理解的模式的过程。该过程的关键目的是获得场景的三维语义地图,目前主要有两种思路,一种是先重建出场景的三维几何点云,然后利用三维点云语义分割方法将该点云地图进行语义分割,最终获得场景的三维语义地图。由于现有点云语义分割算法性能的局限性,其很难直接分割重建得到的带有大量噪点的场景点 ...
【技术保护点】
1.一种三维语义地图的构建方法,其特征在于,包括:/n获取环境图像集合;所述环境图像集合包括彩色图像序列和深度图像序列;所述彩色图像序列和所述深度图像序列一一对应;/n根据已训练的语义分割模型对所述环境图像集合进行语义分割,得到语义图像序列;所述语义图像序列和所述彩色图像序列一一对应;/n根据所述深度图像序列和所述环境图像集合中每张环境图像中的位姿信息将所述语义图像序列的每帧语义图像投射到预先建立的三维坐标系上,得到每帧语义图像对应的点云;/n基于所述每帧语义图像对应的点云确定第一点云集合,所述第一点云集合中的第一点云对应所述每帧语义图像;/n对所述第一点云集合进行滤波,得到所述滤波后的第一点云集合;/n对所述滤波后的第一点云集合中的第一点云进行聚类处理,得到第二点云集合;所述第二点云集合中的第二点云包括至少一个第一点云,且所述第二点云中的第一点云为连续的第一点云;/n对所述第二点云集合进行滤波,得到三维语义地图。/n
【技术特征摘要】
1.一种三维语义地图的构建方法,其特征在于,包括:
获取环境图像集合;所述环境图像集合包括彩色图像序列和深度图像序列;所述彩色图像序列和所述深度图像序列一一对应;
根据已训练的语义分割模型对所述环境图像集合进行语义分割,得到语义图像序列;所述语义图像序列和所述彩色图像序列一一对应;
根据所述深度图像序列和所述环境图像集合中每张环境图像中的位姿信息将所述语义图像序列的每帧语义图像投射到预先建立的三维坐标系上,得到每帧语义图像对应的点云;
基于所述每帧语义图像对应的点云确定第一点云集合,所述第一点云集合中的第一点云对应所述每帧语义图像;
对所述第一点云集合进行滤波,得到所述滤波后的第一点云集合;
对所述滤波后的第一点云集合中的第一点云进行聚类处理,得到第二点云集合;所述第二点云集合中的第二点云包括至少一个第一点云,且所述第二点云中的第一点云为连续的第一点云;
对所述第二点云集合进行滤波,得到三维语义地图。
2.根据权利要求1所述的方法,其特征在于,所述已训练的语义分割模型为多层级结构;每个所述层级结构包括主流网络子模块、辅流网络子模块和融合模块;
所述当前层级结构的主流网络子模块的输入端与所述上一层级结构中的融合模块的输出端连接;
所述当前层级结构的辅流网络子模块的输入端与所述上一层级结构中的辅流网络子模块的输出端连接;
所述融合模块包括第一拼接模块、第一注意力模块、第二注意力模块、第一乘法器、第二乘法器、加法器、第二拼接模块、第一卷积模块和第二卷积模块;
所述第一拼接模块的输入端分别和所述上一层级结构中的主流网络子模块的输出端和所述上一层级结构中的辅流网络子模块的输出端连接;
所述第一注意力模块的输入端与所述第二注意力模块的输入端均与所述第一拼接模块的输出端连接;
所述第一乘法器的输入端分别与所述上一层级结构中的主流网络子模块的输出端和所述第一注意力模块的输出端连接;所述第二乘法器的输入端分别与所述上一层级结构中的辅流网络子模块的输出端和所述第二注意力模块的输出端连接;
所述加法器的输入端分别与所述第一乘法器的输出端和所述第二乘法器的输出端连接;
所述第一卷积模块的输入端与所述上一层的融合模块的输出端连接;
所述第二拼接模块的输入端分别与所述加法器的输出端和所述第一卷积模块的输出端连接;
所述第二卷积模块的输入端与所述第二拼接模块的输出端连接。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括基于带有歧视的交叉熵损失函数对未训练的语义分隔模型进行训练,得到所述已训练的语义分割模型的步骤;
所述基于带有歧视的交叉熵损失函数对未训练的语义分隔模型进行训练,得到所述已训练的语义分割模型,包括:
确定所述带有歧视的交叉熵损失函数;
根据所述未训练的语义分隔模型对训练数据进行语义分割,得到第一语义图像;
基于所述交叉熵损失函数、第一语义图像和理想语义图像确定损失值;
当所述损失值大于预设阈值时,基于所述损失值进行反向传播,对所述未训练的语义分隔模型进行更新以得到更新后的语义分隔模型;重复步骤:根据所述未训练的语义分隔模型对训练数据进行语义分割,得到第一语义图像;基于所述交叉熵损失函数、第一语义图像和理想语义图像确定损失值;
当所述损失值小于预设阈值时,得到所述已训练的语义分割模型。
4.根据权利要求3所述的方法,其特征在于,所述确定所述带有歧视的交叉熵损失函数,包括:
确定所述语义序列的每帧语义图像中每个像素的内敛值,得到内敛图;所述内敛值是当前像素和最近不同类像素之间的距离值;
基于所述内敛图确定歧视性掩膜;
基于所述歧视性掩膜确定所述带有歧视的交叉熵损失函数。
5.根据权利要求1所述的方法,其特征在于,所述对所述第一点云集合进行滤波,包括:
针对所述第一点云集合中的每个第一点云:将所述第一点云分隔成多个点集合;确定所述第一点云中每个特征点所属的对象类别;
针对所述多个点集合中的每个点集合:从所述点集合中确定质心点,基于所述质心点所属的对象类别确定目标点集合;所述目标点集合中...
【专利技术属性】
技术研发人员:李嘉茂,石文君,张晓林,朱冬晨,
申请(专利权)人:中国科学院上海微系统与信息技术研究所,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。