多尺度场景识别方法、系统、介质、设备及数据处理终端技术方案

技术编号:37669843 阅读:25 留言:0更新日期:2023-05-26 04:30
本发明专利技术属于地图测绘技术领域,公开了一种多尺度场景识别方法、系统、介质、设备及数据处理终端,所述多尺度场景识别方法以俯视路面图像为对象,包括基于俯视路面图像的迁移学习训练和基于LIFT的多尺度场景识别阶段。相比于传统方法,本发明专利技术利用深度学习提取俯视路面图像特征,提取的特征具有更高的表征能力和鲁棒性,并通过引入路面场景特征,极大地提高匹配效率,实现低成本、高精度和高效的场景识别。本方法利用深度学习提取的特征具有更高的表征能力和鲁棒性,提高俯视路面图像特征的表征能力。由于本方法提取的特征包含路面场景特征和LIFT图像局部特征,相比于路面场景语义特征,本方法的表征能力更强,实现场景识别的效率更高。高。高。

【技术实现步骤摘要】
多尺度场景识别方法、系统、介质、设备及数据处理终端


[0001]本专利技术属于地图测绘
,尤其涉及一种多尺度场景识别方法、系统、介质、设备及数据处理终端。

技术介绍

[0002]目前,车辆定位是实现无人车感知的关键环节,其中,场景识别的功能是找到距离待定位节点最近的一个地图节点,是实现车辆定位的关键步骤。精确且高效的场景识别将极大提高车辆定位的精度和效率。传统场景识别是基于图像局部特征实现,而道路环境易受到光照、环境和季节变化的影响,使图像像素的变化较大,无法提取稳定的图像局部特征。
[0003]目前,在场景识别方面已有一些成果,例如已申请的专利CN 111091099 A,申请日2019年12月20日,专利名为“一种场景识别模型的构建方法、场景识别方法及设备”,公开了一种利用场景语义特征实现的场景识别方法和装置;已授权的专利CN 106960591 B,授权日2018年11月30日,专利名为“一种基于道路指纹的车辆高精度定为装置及方法”,公开了一种利用ORB提取俯视路面图像特征,实现场景识别。但该方法是基于人工设计的图像特征描述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多尺度场景识别方法,其特征在于,所述多尺度场景识别方法包括基于俯视路面图像的迁移学习训练和基于LIFT的多尺度场景识别阶段,包括:在俯视路面图像的迁移学习训练阶段,利用俯视图像构建路面场景特征的迁移学习数据库,并对深度学习网络进行迁移训练;利用俯视路面图像构建迁移训练数据集对LIFT网络进行迁移训练,用于实现路面图像局部特征点匹配;在定位阶段,利用GPS结合路面场景实现初定位,筛选出距离待定位节点较近的地图节点;利用LIFT匹配待定位节点和筛选节点的图像局部特征点,并利用RANSAC去除错误匹配的特征点;通过比较匹配点的数量,定位到距离待定位节点最近的地图节点,实现场景识别;所述深度学习网络包括AlexNet、VGGNet和ResNet。2.如权利要求1所述的多尺度场景识别方法,其特征在于,所述基于俯视路面图像的迁移学习是指构建路面场景迁移训练集,并修改深度学习网络的损失函数,从而使经过迁移学习的深度神经网络能识别路面场景;利用路面图像迁移训练集训练LIFT网络,用于提取俯视路面图像的图像局部特征点;采集俯视路面图像,并按照一定比例构建训练集、测试集和验证集;根据路面场景的种类,修改深度神经网络的损失函数,使经过迁移学习的深度神经网络识别路面场景;根据LIFT网络的要求构建迁移训练数据集,并对LIFT网络进行迁移训练,用于提取俯视路面的图像局部特征点。3.如权利要求1所述的多尺度场景识别方法,其特征在于,所述迁移学习训练阶段,包括:(1)路面场景迁移学习路面场景包含两类:1)有路面标志的路面场景,即俯视图像中存在车道线、井盖、减速带和路面文字等标志;2)无路面标志的路面场景,即俯视图像不包含任何路面标志;由于深度神经网络是实现多目标识别,而路面场景识别为二分类任务,故需要重新设计网络的损失函数;定义μ为目标类别,当μ=1时,路面图像包含路面标志,当μ=0时,路面图像不包含路面标志,所述损失函数公式如下所示:L(p,u)=

log[pu+(1

u)(1

p)];式中,p代表路面图像包含路面标志的概率;由于深度神经网络结构被精心设计,故只修改深度神经网络的损失函数,不改变网络的中间层结构;(2)LIFT网络迁移学习由于路面纹理图像具有不同于其他物体的纹理特点,故需要构建迁移训练集对LIFT进行迁移训练,用于提取俯视路面的图像特征;根据LIFT网络的要求,构建迁移训练数据集;将构建的迁移训练数据集按照一定比例构建训练集、测试集和验证集,用于充分地训练LIFT网络;通过设置迁移学习超参数,实现LIFT网络的迁移学习,从而提取俯视路面的图像局部特征。4.如权利要求1所述的多尺度场景识别方法,其特征在于,所述多尺度场景识别是指利用GPS和路面场景特征实现初定位,再利用LIFT网络结合RANSAC匹配两个节点图像的图像局部特征点,根据匹配的匹配图像特征点的数量,实现场景识别。5.如权利要求1所述的多尺度场景识别方法,其特征在于,所述基于GPS和路面场景的
初定位方法,包括:深度神经网络识别路面场景后,以GPS为定位依据,计算距离待定位节点较近的候选地图节点;以待定位节点的路面场景为匹配依据,对候选的地图节点进行筛选,减少候选的地图节点;其中,所述基于LIFT的场景识别方法,包括:将待定位节点和候选地图节点的图像载入到经过LIFT网络中,匹配两幅图像的图像局部特征点,并通过RANSAC算法去除错误的匹配特征点;将候选地图节点的图像和待定位节点的图像进行一一匹配;通过比较候选地图节点和待定位节点的图像局部特征点匹配的数量,定位到距离待定位节点最近的地图节点,实现场景识别。6.如权利要求1所述的多尺度场景识别方法,其特征在于,所述多尺度场景识别阶段,包括:(1)基于GPS和路面场景的初定位通过匹配待定位节点和地图节点的GPS信...

【专利技术属性】
技术研发人员:严忠贞
申请(专利权)人:武汉倾宇科技有限公司
类型:发明
国别省市:

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1