当前位置: 首页 > 专利查询>浙江大学专利>正文

基于语义梯度点以及道路幂点的视觉场景识别方法技术

技术编号:32877518 阅读:24 留言:0更新日期:2022-04-02 12:10
一种基于语义梯度点以及道路幂点的视觉场景识别方法,利用语义梯度点在强场景外表变化下可被重复检测的特性、语义梯度点不同层特征的不同优势以及场景本身的结构,提升在极具挑战场景下的性能。语义梯度点在强场景外表变化下可被重复检测的特性保证了正确匹配两者间所采纳特征的交集;将语义梯度点不同层的特征拼接在一起,能够利用不同层特征对于场景外表变化以及相机视角变化的不同特性;根据道路幂点划分区域并且在计算相似度时考虑区域间的对应关系,能够增加视觉重叠部分在相似度计算中的权重,更加专注于视觉重叠部分,排除无关部分的干扰。关部分的干扰。关部分的干扰。

【技术实现步骤摘要】
基于语义梯度点以及道路幂点的视觉场景识别方法


[0001]本专利技术涉及视觉场景识别(Visual Place Recognition,VPR)
,尤其涉及一种基于语义梯度点以及道路幂点的视觉场景识别方法。

技术介绍

[0002]视觉场景识别(Visual Place Recognition,VPR)或者闭环检测技术是视觉即时定位与地图构建(visual Simultaneous Localization and Mapping,vSLAM)的重要组成部分。视觉场景识别是检测闭环的关键,有助于提高定位精度并降低所构建地图的不确定性。传统视觉场景识别在一些特定场景下能够达到令人满意的效果,例如短期任务(短时间内重访同一地点),一定程度的场景外表变化,以及一定程度的视角变化等。然而,对于长期任务下的挑战性场景,例如场景外表变化(一天中的不同时间段、不同季节以及不同光照条件)和强相机视角变化,传统视觉场景识别的性能显著下降。
[0003]机器人领域相关技术与计算机视觉相关技术的不断进步,以及对于长期自主系统的需求,不断推动着视觉场景识别的发展。基于卷积神经网络的视觉场景识别成为当下研究热点,并且在强场景外表变化下的性能上有一定提升。然而在极具挑战场景(强场景外表变化与强相机视角变化相结合)下,其性能仍有极大提升空间。

技术实现思路

[0004]为了克服现有技术的不足,本专利技术提供一种基于语义梯度点以及道路幂点的视觉场景识别方法,利用语义梯度点在强场景外表变化下可被重复检测的特性、语义梯度点不同层特征的不同优势以及场景本身的结构,提升在极具挑战场景下的性能。
[0005]本专利技术解决其技术问题所采用的技术方案是:
[0006]一种基于语义梯度点以及道路幂点的视觉场景识别方法,包括以下步骤:
[0007]步骤1,语义特征提取,利用语义分割网络对图像进行处理,保留中间层特征、logits层特征以及最后的语义标签;
[0008]步骤2,语义梯度点检测,计算logits层特征所有通道的绝对梯度和,筛选出绝对梯度和较高的点,保留其在图像中的位置信息;
[0009]步骤3,语义梯度点特征拼接,根据语义梯度点位置信息,将同一语义梯度点在中间层的特征以及logits层的特征分别进行L2正则化后展开拼接在一起;
[0010]步骤4,道路幂点检测,利用语义标签得到道路目标与其他静态语义类别目标的边界,然后利用霍夫变换得到图像中的道路线,最后计算道路线的交点并加权得到道路幂点;
[0011]步骤5,图像描述子生成,根据道路幂点对图像进行区域划分,每个区域分别利用区域内语义梯度点的特征生成一个VLAD描述子,称为语义结构化VLAD;
[0012]步骤6,相似度计算,由于每个图像可能存在1个或者2个语义结构化VLAD,计算相似度时需要先明确他们之间的对应关系,即使得语义结构化VLAD相似度之和最大,然后以该对应关系下语义结构化VLAD的平均相似度作为图像的相似度,遍历数据库中的所有图
像,图像以语义结构化VLAD形式存储,以相似度最高的图像作为最终结果。
[0013]进一步地,在所述步骤2中,语义梯度点检测的步骤如下:
[0014]步骤2

1,计算logits层特征所有通道的绝对梯度和,Logits层(W
×
H
×
C)特征的每个通道可以认为是对应语义类别的概率,但是不同通道间存在相互干扰的情况,因此以所有通道的绝对梯度和来作为筛选语义特征点的依据:
[0015][0016]其中N
C
是通道个数,i是通道的标签,G
i
是通道i的梯度,G
sum
是所有通道的绝对梯度和;
[0017]步骤2

2,将整个图像划分成N
s
个正方形小块,若该正方形小块中的最大绝对梯度和大于G
θ
,则将该最大绝对梯度和对应的语义梯度点作为备选;
[0018]步骤2

3,为使得语义梯度点能够均匀分布在图像各处,将整个图像沿横轴划分成k个直方图,每个直方图按绝对梯度和对备选的语义梯度点排序,筛选出前N
k
个点作为最终的语义梯度点。
[0019]再进一步地,在所述步骤4中,道路幂点检测的步骤如下:
[0020]步骤4

1,利用语义标签得到道路目标与其他静态语义类别的边界,所述其他静态语义类别包括人行道、建筑和交通标志等;
[0021]步骤4

2,利用霍夫变换将道路边界转化为道路线,即道路在图像中的二维几何表示;
[0022]步骤4

3,计算道路线的交点,为了防止道路同一侧道路线的相互干扰,只计算角度差大于a
θ
的道路线的交点;
[0023]步骤4

4,计算所有道路线交点的平均位置,作为最终的道路幂点。
[0024]更进一步地,在所述步骤5中,若存在道路幂点,则分为两个区域;若不存在道路幂点,则整个图像视为一个区域。
[0025]所述步骤5中,图像描述子的生成结合了场景的结构,分区生成描述子,过程如下:
[0026]首先根据道路幂点对图像进行区域划分,若存在道路幂点,则划分为两个区域,若不存在道路幂点,则整个图像视为一个区域;每个区域分别利用区域内语义梯度点的特征生成语义结构化VLAD:
[0027]预先离线训练好的字典树C={c1,c2,

c
W
},用x表示d

维的特征,每一个x都会和与之最近的视觉单词c
i
相关联(c
i
=f
v
(x)),对于每一个视觉单词c
i
,VLAD累积每一个与c
i
相关联的x与c
i
的差异:
[0028][0029]其中i是视觉单词的索引,而j是特征维度的索引;
[0030]L2正则化每一视觉单词对应的VLAD块,即:
[0031][0032]最后L2正则化整个VLAD描述子,最终图像中的每个区域都有一个语义结构化
VLAD。
[0033]进一步地,在所述步骤6中,图像相似度计算需要考虑语义结构化VLAD的对应关系,过程如下:
[0034]每个图像可能存在1个或2个语义结构化VLAD,即当计算两个图像相似度时会出现四种情况:1vs1,1vs2,2vs1以及2vs2,前三种情况的对应关系较为直接,只有一种对应关系,而最后一种情况,则有两种对应关系;所述方法选择使得语义结构化VLAD相似度之和最大的对应关系来计算最终相似度,即该对应关系下语义结构化VLAD的平均相似度。
[0035]本专利技术的有益效果主要表现在:利用语义梯度点在强场景外表变化下可被重复检测的特性、语义梯度点不同层特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于语义梯度点以及道路幂点的视觉场景识别方法,其特征在于,所述方法包括以下步骤:步骤1,语义特征提取,利用语义分割网络对图像进行处理,保留中间层特征、logits层特征以及最后的语义标签;步骤2,语义梯度点检测,计算logits层特征所有通道的绝对梯度和,筛选出绝对梯度和较高的点,保留其在图像中的位置信息;步骤3,语义梯度点特征拼接,根据语义梯度点位置信息,将同一语义梯度点在中间层的特征以及logits层的特征分别进行L2正则化后展开拼接在一起;步骤4,道路幂点检测,利用语义标签得到道路目标与其他静态语义类别目标的边界,然后利用霍夫变换得到图像中的道路线,最后计算道路线的交点并加权得到道路幂点;步骤5,图像描述子生成,根据道路幂点对图像进行区域划分,每个区域分别利用区域内语义梯度点的特征生成一个VLAD描述子,称为语义结构化VLAD;步骤6,相似度计算,由于每个图像可能存在1个或者2个语义结构化VLAD,计算相似度时需要先明确他们之间的对应关系,即使得语义结构化VLAD相似度之和最大,然后以该对应关系下语义结构化VLAD的平均相似度作为图像的相似度,遍历数据库中的所有图像,以相似度最高的图像作为最终结果。2.如权利要求1所述的基于语义梯度点以及道路幂点的视觉场景识别方法,其特征在于,在所述步骤2中,语义梯度点检测的步骤如下:步骤2

1,计算logits层特征所有通道的绝对梯度和,Logits层(W
×
H
×
C)特征的每个通道可以认为是对应语义类别的概率,但是不同通道间存在相互干扰的情况,因此以所有通道的绝对梯度和来作为筛选语义特征点的依据:其中N
C
是通道个数,i是通道的标签,G
i
是通道i的梯度,G
sum
是所有通道的绝对梯度和;步骤2

2,将整个图像划分成N
s
个正方形小块,若该正方形小块中的最大绝对梯度和大于G
θ
,则将该最大绝对梯度和对应的语义梯度点作为备选;步骤2

3,为使得语义梯度点能够均匀分布在图像各处,将整个图像沿横轴划分成k个直方图,每个直方图按绝对梯度和对备选的语义梯度点排序,筛选出前N
k
个点作为最终的语义梯度点。3.如权利要求1或2所述的基于语义梯度点以及道路幂点的视觉场景识别方法,其特征在于,在所述步骤...

【专利技术属性】
技术研发人员:潘赟包瑶琦杨哲朱怀宇
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1