基于混合KAZE算法构建词包模型的图像检索方法技术

技术编号:36400654 阅读:10 留言:0更新日期:2023-01-18 10:07
本申请涉及一种基于混合KAZE算法构建词包模型的图像检索方法。通过使用预先设置的特征提取算法分别提取图像中区域与边缘的特征向量,然后将二者的特征向量分别进行特征量化以及构建索引得到二者的视觉词包,同时将二者的视觉词包分别向量化得到二者的词包向量,将二者的视觉词包并列得到混合视觉词包;同时也将二者的词包向量分别进行特征匹配得到二者的相似度,根据二者的相似度计算得到混合相似度,再将图像数据库中图像按照混合相似度进行降序排列得到初始图像检索结果,最后结合混合视觉词包对初始图像检索结果进行后处理,得到最终图像检索结果。采用本方法可以提升图像检索整体的精确度,让图像检索精度得到有效的提高。高。高。

【技术实现步骤摘要】
基于混合KAZE算法构建词包模型的图像检索方法


[0001]本申请涉及图像识别
,特别是涉及一种基于混合KAZE算法构建词包模型的图像检索方法。

技术介绍

[0002]随着互联网的兴起,网络中的图片数据以惊人的速度增长,形成了巨大的图像检索数据库,针对海量的图片数据,如何通过图像检索获得用户所需的图片成为当下需要解决的技术问题。
[0003]传统技术中,最通用的图像检索借鉴文本检索的思想,将图像类比为一段文本,图像上提取到的局部特征对应文本中的单词,使用单词出现的频数建立词包向量来表示图像,并通过计算比较词包向量之间的相似度来检索图像。这一方法被称为基于词包模型的图像检索方法,主要包括如下五个步骤:特征提取、特征量化、构建索引、特征匹配以及后处理。
[0004]然而,在实现本专利技术的过程中,专利技术人发现前述传统的图像检索方法仍存在着图像检索精度不高的技术问题。

技术实现思路

[0005]基于上述传统图像检索技术的精度不高的问题,提供一种基于混合KAZE算法构建词包模型的图像检索方法,以解决上述问题。
[0006]一种基于混合KAZE算法构建词包模型的图像检索方法,包括:
[0007]利用预先设置的区域特征提取算法提取参考图像的区域特征向量,利用预先设置的边缘特征提取算法提取参考图像的边缘特征向量;图像数据库中所有参考图像的所有区域特征向量用于生成区域视觉词典,所有边缘特征向量用于生成边缘视觉词典;
[0008]分别对区域特征向量和边缘特征向量进行特征量化以及构建索引,得到区域视觉词包和边缘视觉词包,将区域视觉词包和边缘视觉词包向量化得到区域视觉词包向量和边缘视觉词包向量;视觉词包包括视觉单词索引、特征位置和视觉词典容量,视觉词包为区域视觉词包或边缘视觉词包;
[0009]对区域视觉词包与边缘视觉词包进行并列操作,得到混合视觉词包并将混合视觉词包存入后处理程序中;
[0010]分别对区域视觉词包向量与边缘视觉词包向量进行特征匹配,得到区域相似度与边缘相似度;
[0011]将边缘相似度的平方与区域相似度的平方之和开方得到混合相似度;
[0012]将图像数据库中所有参考图像按照混合相似度进行降序排列,获得初始图像检索结果;
[0013]基于初始图像检索结果结合混合视觉词包进行后处理,得到最终图像检索结果。
[0014]在其中一个实施例中,并列操作的过程,包括:
[0015]将区域视觉词包中的视觉单词索引与边缘视觉词包中的视觉单词索引进行并列操作,构成混合视觉词包的混合视觉单词索引;
[0016]将区域视觉词包中特征位置与边缘视觉词包中的特征位置进行并列操作,构成混合视觉词包的混合特征位置;
[0017]将区域视觉词包与边缘视觉词包中的视觉词典容量进行求和操作,构成混合视觉词典容量;
[0018]混合视觉单词索引、混合特征位置与混合视觉词典容量构成混合视觉词包。
[0019]在其中一个实施例中,混合视觉词包包括(n+m)个混合视觉单词索引、(n+m)个混合特征位置和混合视觉词典容量,其中n为区域特征数量,m为边缘特征数量,混合视觉词典容量大小为2Num。
[0020]在其中一个实施例中,区域视觉词包包括n个区域视觉单词索引、n个区域特征位置和区域视觉词典容量,其中区域视觉词典容量大小为Num。
[0021]在其中一个实施例中,边缘视觉词包包括m个边缘视觉单词索引、m个边缘特征位置和边缘视觉词典容量,其中边缘视觉词典容量大小为Num。
[0022]在其中一个实施例中,特征量化以及构建索引的过程,包括:
[0023]将区域特征向量按照向量相似度聚类为区域视觉单词;
[0024]将边缘特征向量按照向量相似度聚类为边缘视觉单词;
[0025]将区域视觉单词与边缘视觉单词合并生成视觉词典;
[0026]将图像的图像特征与视觉词典中的视觉单词进行一一对应生成视觉单词索引,将视觉词典中的视觉单词与图像的图像特征进行一一对应生成倒排索引;
[0027]将图像特征在图像中的位置进行定位得到特征位置,利用视觉单词索引、特征位置和视觉词典容量构成视觉词包。
[0028]在其中一个实施例中,向量化的过程,包括:
[0029]提取视觉词包的视觉单词索引;
[0030]根据视觉单词索引中视觉单词出现的频次以及先后顺序进行排列;
[0031]得到视觉词包向量;视觉词包向量包括区域视觉词包向量与边缘视觉词包向量。
[0032]在其中一个实施例中,特征匹配的过程,包括:
[0033]计算查询图像的区域视觉词包向量与图像数据库中所有参考图像的区域视觉词包向量的余弦距离,得到区域余弦距离,使用1减去区域余弦距离,得到查询图像与所有参考图像的区域相似度;
[0034]计算查询图像的边缘视觉词包向量与图像数据库中所有参考图像的边缘视觉词包向量的余弦距离,得到边缘余弦距离,使用1减去边缘余弦距离,得到查询图像与所有参考图像的边缘相似度。
[0035]在其中一个实施例中,后处理的过程,包括:
[0036]提取初始图像检索结果中混合相似度从高到低的K个参考图像,得到第一参考图像集;
[0037]利用混合视觉词包中的特征位置以及视觉单词索引,将第一参考图像集中参考图像与查询图像进行二次比对;
[0038]通过二次比对产生新的相似度指标,根据新的相似度指标再次进行降序排列,得
到最终图像检索结果。
[0039]值得注意的是预先设置的区域特征提取算法与预先设置的边缘特征提取算法为混合KAZE算法。
[0040]上述一种基于混合KAZE算法构建词包模型的图像检索方法,通过使用预先设置的区域特征提取算法提取图像中的区域特征向量,使用预先设置的边缘特征提取算法提取图像中的边缘特征向量,然后将提取的图像特征向量进行特征构建以及量化索引得到区域视觉词包和边缘视觉词包,然后将区域视觉词包和边缘视觉词包向量化得到区域词包向量和边缘词包向量,将区域视觉词包和边缘视觉词包进行并列操作得到混合视觉词包,并将其用于后续后处理的验证过程;同时也分别将区域词包向量和边缘词包向量继续进行特征匹配分别得到区域相似度和边缘相似度,根据区域相似度和边缘相似度进行计算得到混合相似度,再将图像数据库中的参考图像按照混合相似度进行降序排列得到初始图像检索结果,最后在后处理中结合混合视觉词包对初始图像检索结果进行进一步的过滤和重排序,得到最终图像检索结果。通过将区域视觉词包与边缘视觉词包进行并列得到混合视觉词包,获得更加完整全面的图像特征,将其用于后续后处理的校验过程,使得校验之后的最终图像检索结果更加准确;同时通过计算区域相似度与边缘相似度得到混合相似度,获得更加完整准确的初始图像检索结果,从而整体提升图像检索整体的精确度,使得图像检索精度得到有效的提高。
附图说明
[0041]为了更清楚地说明本申请实施例或传统技术本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于混合KAZE算法构建词包模型的图像检索方法,其特征在于,所述方法包括:利用预先设置的区域特征提取算法提取参考图像的区域特征向量,利用预先设置的边缘特征提取算法提取所述参考图像的边缘特征向量;图像数据库中所有参考图像的所有区域特征向量用于生成区域视觉词典,所有边缘特征向量用于生成边缘视觉词典;分别对所述区域特征向量和所述边缘特征向量进行特征量化以及构建索引,得到区域视觉词包和边缘视觉词包,将所述区域视觉词包和边缘视觉词包向量化得到区域视觉词包向量和边缘视觉词包向量;视觉词包包括视觉单词索引、特征位置和视觉词典容量,所述视觉词包为所述区域视觉词包或所述边缘视觉词包;对所述区域视觉词包与所述边缘视觉词包进行并列操作,得到混合视觉词包并将所述混合视觉词包存入后处理程序中;分别对所述区域视觉词包向量与所述边缘视觉词包向量进行特征匹配,得到区域相似度与边缘相似度;将所述边缘相似度的平方与区域相似度的平方之和开方得到混合相似度;将所述图像数据库中所有参考图像按照所述混合相似度进行降序排列,获得初始图像检索结果;基于所述初始图像检索结果结合所述混合视觉词包进行后处理,得到最终图像检索结果。2.根据权利要求1所述基于混合KAZE算法构建词包模型的图像检索方法,其特征在于,所述并列操作的过程,包括:将所述区域视觉词包中的视觉单词索引与边缘视觉词包中的视觉单词索引进行并列操作,构成混合视觉词包的混合视觉单词索引;将所述区域视觉词包中特征位置与边缘视觉词包中的特征位置进行并列操作,构成混合视觉词包的混合特征位置;将所述区域视觉词包与所述边缘视觉词包中的视觉词典容量进行求和操作,构成混合视觉词典容量;所述混合视觉单词索引、混合特征位置与混合视觉词典容量构成混合视觉词包。3.根据权利要求2所述并列操作的过程,其特征在于,所述混合视觉词包包括(n+m)个混合视觉单词索引、(n+m)个混合特征位置和混合视觉词典容量,其中n为区域特征数量,m为边缘特征数量,所述混合视觉词典容量大小为2Num。4.根据权利要求1所述基于混合KAZE算法构建词包模型的图像检索方法,其特征在于,所述区域视觉词包包括n个区域视觉单词索引、n个区域特征位置和区域视觉词典容量,其中所述区域视觉词典容量大小为Num。5.根据权利要求1所述基于混合KAZE算法构建词包模型的图像检索方法,其特征在...

【专利技术属性】
技术研发人员:毛伟戴骏飞周辉峰袁化宇覃国辉安家驰易谋林晨马晓斌张学成
申请(专利权)人:中国人民解放军六三八一六部队
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1