当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于图像注意力加权池化的室外地点重识别方法技术

技术编号:34133872 阅读:89 留言:0更新日期:2022-07-14 16:07
本发明专利技术提供了一种基于图像注意力加权池化的室外地点重识别方法,属于计算机视觉深度学习技术领域。解决了室外场景下地点重识别任务容易受到动态物体干扰的问题。其技术方案为:包括以下步骤:步骤一、从卷积神经网络提取特征图;步骤二、显著性区域的检测;步骤三、生成图像注意力;步骤四、损失函数计算损失。本发明专利技术的有益效果为:本发明专利技术检测图片最显著的部分同时抑制动态物体的干扰;在室外场景下能提取鲁棒性更强的图像全局特征,减少误匹配。减少误匹配。减少误匹配。

【技术实现步骤摘要】
一种基于图像注意力加权池化的室外地点重识别方法


[0001]本专利技术涉及计算机视觉、深度学习
,尤其涉及一种基于图像注意力加权池化的室外地点重识别方法。

技术介绍

[0002]视觉地点重识别是计算机视觉研究领域中十分重要的一项研究,特别是长期自主导航的移动机器人,图像定位等。视觉地点重识别可以看作是大规模图像检索任务,在数据库中检索出与查询图片最为相似的图片。但在室外场景下,由于光照变化、动态物体遮挡、视点变化和季节变化等原因使得该项任务变得十分困难。即使是相同的场景地点下的也会有完全不一样的外观。因此,如何创建鲁棒的图片特征成为了研究的难点。
[0003]为了区分任务相关的视觉线索,图像注意力机制在近些年被提出。图像注意力机制可以分为数据驱动的方法和基于规则的方法。基于规则的方法过于依赖先验知识,容易忽略人类认知以外的因素。数据驱动的方法通过大量数据训练,检测到具有区别性的显著性区域,通常以矩形方框表示。但显著性物体例如建筑、路标等有可能是任何形状,而且由于物体遮挡的因素,只用矩阵形状的方框代表显著性物体的方法仍然是不足的。<本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图像注意力加权池化的室外地点重识别方法,其特征在于,包括以下步骤:步骤一、从卷积神经网络提取特征图通过预训练的卷积神经网络模型对输入图片进行特征的提取,卷积神经网络模型由卷积层、激活层、池化层和全连接层组成;卷积层嵌入空间信息,由卷积层输出的特征图被看作是卷积核在图像中提取到的特征描述子,把图像输入卷积神经网络模型后,在进行全连接操作之前输出,得到维度为W
×
H
×
C的特征图,W和H分别为特征图的宽和高,C为特征图的通道数,把这个特征图看作是多个图像描述子的集合F,其中,每个特征描述子的维度为C,总共有W
×
H个特征,其中,每个描述子代表输入图像中一个区域的感受野,如下公式:F={f
i
∈R
C
|i{1,...,W
×
H}}
ꢀꢀꢀ
(1);步骤二、显著性区域的检测通过步骤一处理得到图像局部描述子的集合F,卷积神经网络模型对图像的每个均匀的区域提取对应的描述子,单个局部描述子不能代表图像中具有代表性的建筑或物体,它是地标的其中一部分或者是某些不具有代表性的空间信息,从局部描述子中检测出具有代表性的显著性区域;描述子集合F包含了在单一尺度的刚性网格下图像的感受野,描述子提取的过程中,卷积核平均对图像进行提取,该过程并没有考虑到物体信息是否被完整地提取到同一个局部描述子中,在图像中划分多个尺度的空间网格并提取不同感受野下的特征;特征图中的激活值是图像经过卷积操作后得到的检测分数,特征图中的非零值代表着感受野中的语义信息,当激活值越大,该区域的视觉信息就越显著,通过这个观察,假设激活值越大,该区域的显著性越强,除了检测区域空间信息强度的大小之外,要检测空间信息之间的关联性,把候选区域定义为非零激活值之间的的8连通区域,考虑图像的空间信息强度,把各个激活值对应的感受野区域联系在一起形成显著区域;划分非零激活值的8连通区域得到S,其中,M代表候选区域的数量,对于每个候选区域S,计算S的激活值的平均值,保留平均值最大的N个区域得到显著区域K;K
j
={S
...

【专利技术属性】
技术研发人员:张晓峰欧垚君陈哲王梅丁红施正阳陶秦魏东
申请(专利权)人:南通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1