一种基于关键局部信息的图像检索方法技术

技术编号:38266270 阅读:7 留言:0更新日期:2023-07-27 10:23
本发明专利技术实施例公开了一种基于关键局部信息的图像检索方法、装置、系统,涉及图像处理技术领域,能够实现利用关键局部内容检索得到其主体的完整图像,从而提升检索准确度。本发明专利技术包括:原始图库图像处理;查询图像特征提取;相似度检索过程。具体为:调整原始图像尺寸,提取图库原始图像卷积特征,对卷积特征图聚类,根据聚类特征图生成关键内容区域,对原始图像以及关键内容区域进行特征提取得到特征向量,调整查询图像尺寸,提取查询图像的特征向量,计算查询图像与原始图库图像及其关键内容区域的相似度,根据结果排序并返回对应原始图像。本发明专利技术适用于查询图像不具备完整性但是包含足以检索到原图的关键信息的图像检索任务。足以检索到原图的关键信息的图像检索任务。足以检索到原图的关键信息的图像检索任务。

【技术实现步骤摘要】
一种基于关键局部信息的图像检索方法


[0001]本专利技术涉及图像处理
,尤其涉及一种基于关键局部信息的图像检索方法。

技术介绍

[0002]图像信息的处理和检索是进行信息推理、决策的重要一环,然而在实际应用中,普遍存在图像信息残缺、检索内容不完整的情况。尽管这类问题通常可以随着侦察技术、图像采集技术和成像技术进步略有缓解,但是在只能获得有限信息的前提下,一种能够解决图像信息不完备问题的系统尤为关键。
[0003]现有的图像检索技术大多以整个图像为单位提取全局特征,获得能表征图像信息的特征向量,进而做相似度检索,这导致用户受到了查询图像完整性的限制。当输入的查询图像仅为目标的一小部分,而图库中没有对应区域的图像时,往往无法达到检索到原目标的效果。少数关注到此问题的图像检索技术采用了较为单一的图像区域划分方式,难以关注重要特征区域;或采用有监督的方式训练神经网络模型,进行关键特征区域的划分,但是这种方式需要消耗人力标注数据集,且引入人的因素导致关键内容区域划分较为主观。并且,由于此类模型是按照某些特定类别进行训练的,训练好的网络难以用于跨类别进行区域划分。这就导致了难以实现查询图像不具备完整性但是包含足以检索到原图的关键信息的图像检索任务。

技术实现思路

[0004]本专利技术的实施例提供一种基于关键局部信息的图像检索方法,能够实现利用关键局部内容检索得到其主体的完整图像,从而提升检索准确度。
[0005]为达到上述目的,本专利技术的实施例采用如下技术方案:
[0006]第一方面,本专利技术的实施例提供的方法,包括:
[0007]S1、对原始图像进行预处理,获取对应关键内容区域的关键内容特征;
[0008]S2、接收用户上传的待查询图像,并提取待查询图像的图像特征;
[0009]S3、利用数据图库中各原始图像的全局特征和关键内容特征,对所述待查询图像进行相似度检索。
[0010]结合第一方面,在第一方面的第一种可能的实现方式中,在S1中,所述预处理包括:
[0011]S11、提取原始图像的卷积特征,并形成卷积特征图;
[0012]S12、对所得到的卷积特征图进行聚类,得到聚类特征图;
[0013]S13、根据所述聚类特征图生成关键内容区域;
[0014]S14、对所述原始图像和关键内容区域分别进行特征提取,得到所述原始图像和关键内容区域各自的特征向量。
[0015]结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,在S11中,
所述提取原始图像的卷积特征并形成卷积特征图包括:
[0016]调整所述原始图像最短边尺寸至预设值;
[0017]通过深度残差网络提取得到特征图,其中,所述深度残差网络中加入特征修正模块;
[0018]通过所述特征修正模块,获取给定的中间特征图的注意力权重,将所获取的注意力权重与所述给定的中间特征图相乘,得到带有注意力的特征图,其中,所述给定的中间特征图由所述深度残差网络中的残差模块输出。
[0019]结合第一方面的第二种可能的实现方式,在第三种可能的实现方式中,所述特征修正模块包括:空间自注意力模块M
self
、通道注意力模块M
channel
和空间注意力模块M
spatial

[0020][0021][0022][0023]其中,F表示给定的中间特征图,F'表示空间自注意力修正特征,F”表示通道注意力修正特征,F”'表示空间注意力修正特征,算符表示按元素相乘。所述通过特征修正模块,从给定的中间特征图得到注意力权重,包括:
[0024]在所述空间自注意力模块中,将所述给定的中间特征图经过1
×
1卷积操作降维得到1
×
H
×
W的特征张量,然后经过Sigmoid激励函数将特征值转换到[0,1]区间,再利用SoftMax函数获得空间自注意力权重M
self
,通过将空间自注意力权重和输入特征逐元素相乘获得空间自注意力修正特征,其中,H表示图片的高度尺寸,W表示图片的宽度尺寸。
[0025]结合第一方面的第三种可能的实现方式,在第四种可能的实现方式中,所述通过特征修正模块,从给定的中间特征图得到注意力权重,还包括:
[0026]通过所述通道注意力模块,分别按照空间最大池化和平均池化处理所述空间自注意力修正特征,得到两个维度为C
×1×
1的特征张量,C表示通道数;
[0027]之后将所得到的两个维度为C
×1×
1的特征张量经过共享的C个1
×
1网络,映射成两个维度为C
×1×
1的新的特征张量,将得到的两个新的特征张量逐元素相加后,经过SoftMax激活函数输出为一个维度为C
×1×
1的通道注意力权重M
channel

[0028]将通道注意力权重和输入的空间自注意力修正特征逐元素相乘,获得通道注意力修正特征。
[0029]结合第一方面的第三或四种可能的实现方式,在第五种可能的实现方式中,所述通过特征修正模块,从给定的中间特征图得到注意力权重,还包括:通过所述空间注意力模块,分别按照通道最大池化和平均池化处理所述通道注意力修正特征,得到两个维度为1
×
H
×
W的特征张量,之后将所得到的两个维度为1
×
H
×
W的特征张量合并形成维度为2
×
H
×
W的特征张量,其中,H表示图片的高度尺寸,W表示图片的宽度尺寸;
[0030]通过一层卷积层,将所得到的维度为2
×
H
×
W的特征张量维度转化为1
×
H
×
W,并作为空间注意力权重,之后将空间注意力权重和输入的通道注意力修正特征逐元素相乘获得空间注意力修正特征。
[0031]结合第一方面的第一种可能的实现方式,在第一方面的第六种可能的实现方式中,在S12中,对所得到的卷积特征图进行聚类,得到聚类特征图,包括:
[0032]在对所得到的卷积特征图中,去除激活不显著的特征图;
[0033]将剩余的卷积特征图按照响应最大的位置分类,之后将同一类的卷积特征图仅保留最大响应值后相加得到聚类特征图,其中,所述保留最大响应值,包括:对于第i张特征图,若其响应值最大位置(H
i
,W
i
)的值则保留,同时其余位置的值置零。
[0034]结合第一方面的第六种可能的实现方式,在第一方面的第七种可能的实现方式中,所述通过聚类工具将剩余的卷积特征图按照响应最大的位置分类,包括:获取每个剩余的卷积特征图中响应值最大的位置,并对位置向量进行聚类;
[0035]在S13中,根据所述聚类特征图生成关键内容区域,包括:
[0036本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于关键局部信息的图像检索方法,其特征在于,包括:S1、对原始图像进行预处理,获取对应关键内容区域的关键内容特征;S2、接收用户上传的待查询图像,并提取待查询图像的图像特征;S3、利用数据图库中各原始图像的全局特征和关键内容特征,对所述待查询图像进行相似度检索。2.根据权利要求1所述的方法,其特征在于,在S1中,所述预处理包括:S11、提取原始图像的卷积特征,并形成卷积特征图;S12、对所得到的卷积特征图进行聚类,得到聚类特征图;S13、根据所述聚类特征图生成关键内容区域;S14、对所述原始图像和关键内容区域分别进行特征提取,得到所述原始图像和关键内容区域各自的特征向量。3.根据权利要求2所述的方法,其特征在于,在S11中,所述提取原始图像的卷积特征并形成卷积特征图包括:调整所述原始图像最短边尺寸至预设值;通过深度残差网络提取得到特征图,其中,所述深度残差网络中加入特征修正模块;通过所述特征修正模块,获取给定的中间特征图的注意力权重,将所获取的注意力权重与所述给定的中间特征图相乘,得到带有注意力的特征图,其中,所述给定的中间特征图由所述深度残差网络中的残差模块输出。4.根据权利要求3所述的方法,其特征在于,所述特征修正模块包括:空间自注意力模块M
self
、通道注意力模块M
channel
和空间注意力模块M
spatial
;;;其中,F表示给定的中间特征图,F'表示空间自注意力修正特征,F”表示通道注意力修正特征,F”'表示空间注意力修正特征,算符表示按元素相乘;所述通过特征修正模块,从给定的中间特征图得到注意力权重,包括:在所述空间自注意力模块中,将所述给定的中间特征图经过1
×
1卷积操作降维得到1
×
H
×
W的特征张量,然后经过Sigmoid激励函数将特征值转换到[0,1]区间,再利用SoftMax函数获得空间自注意力权重M
self
,通过将空间自注意力权重和输入特征逐元素相乘获得空间自注意力修正特征,其中,H表示图片的高度尺寸,W表示图片的宽度尺寸。5.根据权利要求4所述的方法,其特征在于,所述通过特征修正模块,从给定的中间特征图得到注意力权重,还包括:通过所述通道注意力模块,分别按照空间最大池化和平均池化处理所述空间自注意力修正特征,得到两个维度为C
×1×
1的特征张量,C表示通道数;之后将所得到的两个维度为C
×1×
1的特征张量经过共享的C个1
×
1网络,映射成两个维度为C
×1×
1的新的特征张量,将得到的两个新的特征张量逐元素相加后,经过SoftMax激活函数输出为一个维度为C

【专利技术属性】
技术研发人员:陈凯王紫腾李知栩王杰瑞张桐林
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1