一种以图搜图方法技术

技术编号：26342664 阅读：26 留言：0更新日期：2020-11-13 20:36

本申请涉及一种以图搜图方法，构建了多空间尺度孪生神经网络模型，该神经网络模型具有3个不同空间尺度的高层语义匹配层，可以实现跨空间匹配，进而实现了即使将不同尺寸的模板图像和待检索图像作为神经网络模型的输入数据也能够准确检索到与模板图像匹配的待检索图像，模型匹配精准度高，稳定性优良。

A method of searching graph by graph

全部详细技术资料下载

【技术实现步骤摘要】
一种以图搜图方法
本申请涉及图片信息处理
，特别是涉及一种以图搜图方法。
技术介绍
以图搜图是指根据图像视觉特征或者语义特征检索出具有相似内容的图像，是目前互联网上一种新型的检索方式。与以文字作为检索索引的检索方式不同，图像搜索技术的出现，使得用户对网上图像信息的搜索变得更加简单化和多样化。构建一个以图搜图系统需要解决两个最关键的问题：首先，如何提取图像特征；其次，如何构建特征数据搜索引擎，即如何使得特征数据构建成数据库并提供相似性搜索的功能。由于置入匹配模型的模板图像和待检索图像的原始图像大小很有可能不一致，传统的以图搜图的方法的处理方式是在检索前对每张图像缩放一次。这种方式带了的一个很大的问题是，无法确定缩放后的模板图像和待检索图像的大小是否一致。而且。在每张图片检索时都要缩放一次图像，耗费大量的匹配模型计算量。图像缩放过小的话，图像的核心信息提取困难，因为图像缩放后目标边界框所包围的面积过小，核心信息的部分也缩放得过小，和其他非核心信息的部分区别不明显。因此，传统的以图搜图的方法导致匹配模型的匹配精准度不够准确，匹配模型稳定性差。
技术实现思路
基于此，有必要针对传统以图搜图方法无法确定缩放后的模板图像和待检索图像的大小是否一致的问题，提供一种以图搜图方法。本申请提供一种以图搜图方法，所述以图搜图方法包括：选取多张模板图像和多张待检索图像，对多张模板图像和多张待检索图像进行预处理；构建多空间尺度孪生神经网络模型，将多空间尺度孪生神经网络模型作为特征提取器

【技术保护点】
1.一种以图搜图方法，其特征在于，所述以图搜图方法包括：/nS100，选取多张模板图像和多张待检索图像，对多张模板图像和多张待检索图像进行预处理；/nS200，构建多空间尺度孪生神经网络模型，将多空间尺度孪生神经网络模型作为特征提取器，并在多层特征输出层上构建相似度匹配器网络；/nS300，将预处理后的多张模板图像和多张待检索图像作为训练数据，将相似度匹配器网络作为辅助训练的工具，对多空间尺度孪生神经网络进行端对端的训练，得到多空间尺度孪生神经网络模型中的模型参数；/nS400，通过损失函数对模型参数进行校正，得到训练后的多空间尺度孪生神经网络模型；/nS500，当进行以图搜图时，将一张图像作为模板图像，将多张与模板图像近似的图像作为待检索图像，将模板图像和多张待检索图像输入至所述训练后的多空间尺度孪生神经网络模型；/nS600，获取训练后的多空间尺度孪生神经网络模型输出的模板图像的相似度检索结果。/n

【技术特征摘要】
1.一种以图搜图方法，其特征在于，所述以图搜图方法包括：
S100，选取多张模板图像和多张待检索图像，对多张模板图像和多张待检索图像进行预处理；
S200，构建多空间尺度孪生神经网络模型，将多空间尺度孪生神经网络模型作为特征提取器，并在多层特征输出层上构建相似度匹配器网络；
S300，将预处理后的多张模板图像和多张待检索图像作为训练数据，将相似度匹配器网络作为辅助训练的工具，对多空间尺度孪生神经网络进行端对端的训练，得到多空间尺度孪生神经网络模型中的模型参数；
S400，通过损失函数对模型参数进行校正，得到训练后的多空间尺度孪生神经网络模型；
S500，当进行以图搜图时，将一张图像作为模板图像，将多张与模板图像近似的图像作为待检索图像，将模板图像和多张待检索图像输入至所述训练后的多空间尺度孪生神经网络模型；
S600，获取训练后的多空间尺度孪生神经网络模型输出的模板图像的相似度检索结果。

2.根据权利要求1所述的以图搜图方法，其特征在于，所述步骤S100包括：
S110，从图像库中选取M张图像作为模板图像，选取N张图像作为待检索图像；M和N均为大于1的正整数；
S120，对每一张模板图像和每一张待检索图像均进行类别标注；
S130，对每一张模板图像进行缩放处理，得到M张缩放处理后的模板图像；
S140，对每一张待检索图像进行缩放处理，得到N张缩放处理后的待检索图像；
S150，从M张处理后的模板中随机抽取一张，从N张处理后的待检索图像中随机抽取一张，将两张图像组合为一个样本对；
S160，反复执行K次所述步骤S150，得到K个样本对；K为大于1的正整数。

3.根据权利要求2所述的以图搜图方法，其特征在于，所述步骤S130包括：
S131，选取一张模板图像，利用目标边界框将模板图像分为目标区域和非目标区域；
S132，去除模板图像中的非目标区域，保留目标区域和目标边界框；
S133，设定模板图像缩放后的宽和高，依据公式1计算缩放系数；

公式1；
其中，s为缩放系数，w为目标边界框的宽度，h为目标边界框的高度，A1为模板图像缩放后的宽度，B1为模板图像缩放后的高度；
S134，依据缩放系数计算在宽度方向上的填充边缘长度，以及在高度方向上的填充边缘长度；

公式2；
其中，Pw为在宽度方向上的填充边缘长度，Ph为高度方向上的填充边缘长度，在s为缩放系数，w为目标边界框的宽度，h为目标边界框的高度，A1为模板图像缩放后的宽度，B1为模板图像缩放后的高度；
S135，在所述目标边界框的基础上，在宽度方向上扩充Pw，在长度方向上扩充Ph，以在目标边界框的四周形成边缘，将包括目标边界框和边缘的模板图像缩放至宽度为A1，高度为B1的图像；
S136，对每一张模板图像执行所述步骤S131至步骤S135，直至所有模板图像处理完毕。

4.根据权利要求3所述的以图搜图方法，其特征在于，所述步骤S140包括：
S141，选取一张待检索图像，利用目标边界框将待检索图像分为目标区域和非目标区域；
S142，获取目标边界框的中心点，以该中心点为物理中心，裁剪出一个正方形区域，保留待检索图像的正方形区域，将其他区域去除；所述正方形区域的边长大于目标边界框的宽度，小于目标边界框宽度的8倍；
S143，设定待检索图像缩放后的宽度A2和高度B2，将裁剪后的待检索图像缩放至宽度为A2，高度为B2的图像；
S144，反复执行所述步骤S141至步骤S143，直至所有待检索图像处理完毕。

5.根据权利要求4所述的以图搜图方法，其特征在于，所述模板图像缩放后的宽度为127像素，高度为127像素，所述待检索图像缩放后的宽度为255像素，高度为255像素。

6.根据权利要求5所述的以图搜图方法，其特征在于，所述步骤S200包括：
S210，依据全卷积网络架构构建多空间尺度孪生神经网络模型。

7.根据权利要求6所述的以图搜图方法，其特征在于，所述步骤S300包括：
S310，选取一个样本对，将该样本对输入至多空间尺度孪生神经网络模型；
S320，将样本对中的待检索图像通过第一卷积操作，生成第一待检索图像特征模块；
将样本对中的待检索图像通过第二卷积操作，生成第二待...

【专利技术属性】
技术研发人员：罗世操，
申请(专利权)人：杭州雄迈集成电路技术股份有限公司，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人