基于多尺度特征与空间注意力机制融合的图像检索方法技术

技术编号:31703139 阅读:128 留言:0更新日期:2022-01-01 11:04
本发明专利技术公开了一种基于多尺度特征与空间注意力机制融合的图像检索方法,具体为:步骤1,通过卷积神经网络提取图像的特征作为局部特征α;步骤2,对局部特征α输送到全局平均池化层输出作为全局特征β;步骤3,利用卷积模块的注意力机制模块对局部特征α进行处理,得到局部融合特征γ;步骤4,将γ和β进行融合,得到最终特征λ;步骤5,按照步骤1

【技术实现步骤摘要】
基于多尺度特征与空间注意力机制融合的图像检索方法


[0001]本专利技术属于像检索方法
,涉及一种基于多尺度特征与空间注意力机制融合的图像检索方法。

技术介绍

[0002]图像检索是一个浏览、搜索和检索的过程,它是一个大型数字图像数据库中浏览、搜索和检索图像的过程。它的应用包括卫星图像检索、医学成像、图形艺术、法医学、多媒体、电子商务和新闻学。此外,图像检索在同步定位和制图(SLAM)中发挥了重要作用,并已被广泛地应用于诸如移动机器人技术(McManus,Churchill,Maddern,Stewart,&Newman,2014)和自动驾驶(Sattler等人,2018)任务。
[0003]当前的图像检索算法中,由于图像的背景场景和目标内容复杂多变,不能很好的分辨出目标与背景的重要性等问题,导致计算时造成了大量的资源浪费,同时也影响了检索的正确性。目前图像检索算法中,使用的大多数方法都是直接对整张图像提取特征,这样虽然提取了全局特征,但是需要更深的网络。同时没有对图像中的目标部分进行重点提取,并且因为提取了全局特本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多尺度特征与空间注意力机制融合的图像检索方法,其特征在于,具体按照如下步骤实施:步骤1,通过卷积神经网络提取图像的特征作为局部特征α;步骤2,对经步骤1得到的局部特征α输送到全局平均池化层,将所述全局平均池化层的输出作为全局特征β;步骤3,利用卷积模块的注意力机制模块对步骤1得到的局部特征α进行处理,得到局部融合特征γ;步骤4,将步骤3得到的局部融合特征γ和步骤2得到的全局特征β进行融合,得到对应图片的最终特征λ;步骤5,按照步骤1

4的方法提取待查询图像和数据库图像的最终特征λ,并使用曼哈顿距离公式计算待查询图像和数据库图像中每张图像的最终特征λ之间的距离,然后将得到的距离按照由小到大排序,得到匹配的结果。2.根据权利要求1所述的基于多尺度特征与空间注意力机制融合的图像检索方法,其特征在于,所述步骤1采用VGG模型对图像进行特征提取,将VGG模型提取的特征作为局部特征α。3.根据权利要求1所述的基于多尺度特征与空间注意力机制融合的图像检索方法,其特征在于,所述步骤3中所述的卷积模块的注意力机制模块由一个一维的通道注意力模块M
C
∈R
C
×1×1和一个二维的空间注意力模块M
S
∈R1×
H
×
W
串行排列构成,其中C表示通道数,H、W分别表示输入特征图的高度和宽度,R表示有界的空间,图像特征首先输入一维的通道注意力模块,利用特征通道间的关系生成通道特征F

CBAM
,然后将生成的通道特征F

【专利技术属性】
技术研发人员:廖开阳黄港郑元林章明珠王可儿
申请(专利权)人:西安理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1