一种基于深度视觉特征的快速图像检索方法技术

技术编号:37112772 阅读:28 留言:0更新日期:2023-04-01 05:09
本发明专利技术提供了一种基于深度视觉特征的快速图像检索方法,包括以下步骤:S1、对输入图像进行预处理,并提取第一特征图片;S2、对数据集的图片进行批量预处理,并提取第二特征图片;S3、对第一特征图片和第二特征图片进行相似度计算,获得计算结果;S4、根据计算结果查找索引取结果,召回结果并输出;S5、对数据集中的Dog和Cat两类图像进行评估验证;S6、通过卷积神经网络的预训练模型进行评估验证。本发明专利技术简单易行且不会对模型引入任何额外参数,使速度和效率得到了很大的提升;搜索引擎的分数计算快,特征向量相似度精度损失小;在反向搜索引擎上使用余弦相似性可以在抑制内存使用的同时执行高速、高精度的检索方法。高精度的检索方法。高精度的检索方法。

【技术实现步骤摘要】
一种基于深度视觉特征的快速图像检索方法


[0001]本专利技术涉及机器视觉
,尤其涉及一种基于深度视觉特征的快速图像检索方法。

技术介绍

[0002]在当今时代,文档分析、医学图像分析等领域需要利用基于内容的视觉特征进行快速、可扩展的图像检索。卷积神经网络(CNN)激活作为特征在这一领域取得了卓越的性能,在输出层使用softmax函数的深度卷积是视觉特征表示的一种。
[0003]现在,几乎所有的图像检索系统都将其视觉特征索引保存在主存上,响应性提高了,却限制了它们在大数据应用中的适应性。使用大规模的信息检索方法会产生高维的计算成本,同时按比例放大也是一个问题。
[0004]然而,使用基于内存的方法能解决上述问题,索引内存中的所有图像向量,并高速计算余弦相似度,但这种方法需要一个能够使用巨大且高速内存的计算机环境。另一种方法对特征维度压缩方法不需要大量内存,但是会牺牲掉精度。使用转移学习方法、利用搜索结果重新排序和使用特征向量截断来计算内存中的相似度的方法也会遇到搜索精度降低和搜索速度变慢的问题。

技术实现思路

[0005]针对以上相关技术的不足,本专利技术提出一种搜索精度高,速度快的基于深度视觉特征的快速图像检索方法。
[0006]为了解决上述技术问题,本专利技术提供了一种基于深度视觉特征的快速图像检索方法,包括以下步骤:
[0007]S1、对输入图像进行预处理,并提取第一特征图片;
[0008]S2、对数据集的图片进行批量预处理,并提取第二特征图片;r/>[0009]S3、对所述第一特征图片和所述第二特征图片进行相似度计算,获得计算结果;
[0010]S4、根据所述计算结果查找索引取结果,召回结果并输出;
[0011]S5、对所述数据集中的Dog和Cat两类图像进行评估验证;
[0012]S6、通过卷积神经网络的预训练模型进行评估验证。
[0013]优选的,所述S1具体包括以下子步骤:
[0014]S11、建立预训练模型;
[0015]S12、预设输入图像;
[0016]S13、对所述输入图像进行预处理,得到预处理图片;
[0017]S14、将所述预处理图片输入到所述预训练模型中提取第一特征图片。
[0018]优选的,所述S2具体包括以下子步骤:
[0019]将所述训练集中的图片输入到所述预训练模型中进行预处理并批量提取第二特征图片。
[0020]优选的,所述S3具体包括以下子步骤:
[0021]利用基于L2范数索引的弹性搜索余弦相似度的快速计算方法对输入图片和数据集中的图片相似度进行计算。
[0022]优选的,所述S3中,所述余弦相似性计算公式分为两个阶段,向量的L2范数在索引阶段计算并登记在索引中,在搜索阶段计算余弦相似度的表达式(1)和(2);
[0023][0024][0025]所述余弦相似度的得分与向量表示有很高的亲和力,其中特征向量是由softmax函数输出的,余弦相似度表示为表达式(3)和(4);
[0026][0027][0028]其中,i是特征向量元素的变量,n是特征向量的维数,x表示查询向量,y表示检索到的图像向量,y'表示通过L2范数归一化的图像特征向量。
[0029]优选的,所述S4具体包括以下子步骤:
[0030]对图像检索得到的距离进行排序,得到检索结果;其中,选取相识度最大的图片并进行输出。
[0031]优选的,所述S5具体包括以下子步骤:
[0032]通过使用数据集ImageNet

1k中的Dog和Cat这两类图像进行评估验证。
[0033]优选的,选用VGG—16的预训练模型进行评估验证。
[0034]与相关技术相比,本专利技术通过对输入图像进行预处理,并提取第一特征图片;对数据集的图片进行批量预处理,并提取第二特征图片;对所述第一特征图片和所述第二特征图片进行相似度计算,获得计算结果;根据所述计算结果查找索引取结果,召回结果并输出;对所述数据集中的Dog和Cat两类图像进行评估验证;通过卷积神经网络的预训练模型进行评估验证。这样使用了L2范数索引的弹性搜索余弦相似度的快速计算方法,只需几行代码就可实现,简单易行且不会对模型引入任何额外参数,使速度和效率得到了很大的提升;本专利技术解决了搜索引擎的分数计算慢,特征向量截取计算内存中的相似度精度损失大的问题;同时,在反向搜索引擎上使用余弦相似性可以在抑制内存使用的同时执行高速、高精度的检索方法。
附图说明
[0035]下面结合附图详细说明本专利技术。通过结合以下附图所作的详细描述,本专利技术的上述或其他方面的内容将变得更清楚和更容易理解。附图中:
[0036]图1为本专利技术基于深度视觉特征的快速图像检索方法的方法流程图;
[0037]图2为本专利技术S1的方法流程图。
具体实施方式
[0038]下面结合附图详细说明本专利技术的具体实施方式。
[0039]在此记载的具体实施方式/实施例为本专利技术的特定的具体实施方式,用于说明本专利技术的构思,均是解释性和示例性的,不应解释为对本专利技术实施方式及本专利技术范围的限制。除在此记载的实施例外,本领域技术人员还能够基于本申请权利要求书和说明书所公开的内容采用显而易见的其它技术方案,这些技术方案包括采用对在此记载的实施例的做出任何显而易见的替换和修改的技术方案,都在本专利技术的保护范围之内。
[0040]请参考图1

图2所示,其中,图1为本专利技术基于深度视觉特征的快速图像检索方法的方法流程图;图2为本专利技术S1的方法流程图。
[0041]本专利技术提供一种基于深度视觉特征的快速图像检索方法,包括以下步骤:
[0042]S1、对输入图像进行预处理,并提取第一特征图片。
[0043]其中,通过对输入图像进行图像去噪和图像增强等,使得预处理后的图像清晰度高,便于提取的第一特征图片。该第一特征图片可以是输入图像的局部特征和全局特征等。
[0044]对应于训练集中图像的类别,随机选择一张数据集包含的类别图片进入VGG—16网络提取特征。本方法是采用Dog和Cat这两种类别,我们随机选一张猫或狗的照片进行特征提取。
[0045]S2、对数据集的图片进行批量预处理,并提取第二特征图片。
[0046]S3、对所述第一特征图片和所述第二特征图片进行相似度计算,获得计算结果。
[0047]S4、根据所述计算结果查找索引取结果,召回结果并输出;
[0048]S5、对所述数据集中的Dog和Cat两类图像进行评估验证;
[0049]S6、通过卷积神经网络的预训练模型进行评估验证。
[0050]具体的,通过对输入图像进行预处理,并提取第一特征图片;对数据集的图片进行批量预处理,并提取第二特征图片;对所述第一特征图片和所述第二特征图片进行相似度计算,获得计算结果;根据所述计算结果查找索引取结果,召回结果并输出本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度视觉特征的快速图像检索方法,其特征在于,包括以下步骤:S1、对输入图像进行预处理,并提取第一特征图片;S2、对数据集的图片进行批量预处理,并提取第二特征图片;S3、对所述第一特征图片和所述第二特征图片进行相似度计算,获得计算结果;S4、根据所述计算结果查找索引取结果,召回结果并输出;S5、对所述数据集中的Dog和Cat两类图像进行评估验证;S6、通过卷积神经网络的预训练模型进行评估验证。2.如权利要求1所述的基于深度视觉特征的快速图像检索方法,其特征在于,所述S1具体包括以下子步骤:S11、建立预训练模型;S12、预设输入图像;S13、对所述输入图像进行预处理,得到预处理图片;S14、将所述预处理图片输入到所述预训练模型中提取第一特征图片。3.如权利要求2所述的基于深度视觉特征的快速图像检索方法,其特征在于,所述S2具体包括以下子步骤:将所述训练集中的图片输入到所述预训练模型中进行预处理并批量提取第二特征图片。4.如权利要求1所述的基于深度视觉特征的快速图像检索方法,其特征在于,所述S3具体包括以下子步骤:利用基于L2范数索引的弹性搜索余弦相似度的快速计算方法对输入图片和数据集中的图片相似度进行计算。5.如权利要求4所述...

【专利技术属性】
技术研发人员:黄河岑健彬王华龙
申请(专利权)人:佛山市南海区广工大数控装备协同创新研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1