图像库构建方法、图像检索方法、装置及相关设备制造方法及图纸

技术编号:34412175 阅读:16 留言:0更新日期:2022-08-03 22:04
本发明专利技术公开了一种图像库构建方法、图像检索方法、装置、计算机设备及存储介质,所述方法包括:获取图像高维特征集合;对所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇;基于所有簇,构建倒排文件系统;针对每一个簇,对簇中的所有点进行边连接处理,得到簇对应的完整图,并将所有完整图作为当前聚类图;对当前聚类图进行聚类处理,得到至少两个簇中心;基于所有簇中心,构建中间图;将中间图作为当前聚类图,并返回对所述当前聚类图进行聚类处理,得到至少两个簇中心的步骤继续执行,直到中间图对应的层数达到预设层数时,得到多层跳表;基于倒排文件系统和多层跳表,构建图像库。采用本发明专利技术提高对图像进行检索的准确率。确率。确率。

【技术实现步骤摘要】
图像库构建方法、图像检索方法、装置及相关设备


[0001]本专利技术涉及图像检索领域,尤其涉及一种图像库构建方法、图像检索方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着图像处理的发展,高维特征向量使用越来越频繁,如在图像处理中,通过模型对图像进行特征提取,得到一个高维特征向量,该高维特征向量用以表示该图像的特征。现有方式可通过存储高维特征向量,并利用该高维特征向量进行图像检索,得到相似的图像。目前常用通过高维特征向量对图像进行检索的方法有基于量化编码的检索、基于树的检索等,但是,基于量化编码的检索因对高维特征向量进行压缩导致检索的准确率下降,基于树的检索适合维度低,数据量小的检索向量,当存在海量高维特征向量时,则导致检索的准确率下降。
[0003]因此,现有当存在海量高维特征向量时,对图像进行检索存在准确率低的问题。

技术实现思路

[0004]本专利技术实施例提供一种图像库构建方法、图像检索方法、装置、计算机设备和存储介质,以提高在存在海量高维特征向量时,对图像进行检索的准确率。
[0005]为了解决上述技术问题,本申请实施例提供一种图像库构建方法,包括以下步骤:获取图像高维特征集合。
[0006]对所述图像高维特征集合中的所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇,其中,所述簇由点构成,所述点与所述高维特征一一对应。
[0007]基于所有所述簇,构建倒排文件系统。
[0008]针对每一个所述簇,对所述簇中的所有点进行边连接处理,得到所述簇对应的完整图,并将所有所述完整图作为当前聚类图,其中,所有所述完整图为多层跳表的最底层图,所述多层跳表包括N个层,每一个层对应一个图,所述N为大于等于2的正整数;对所述当前聚类图进行聚类处理,得到至少两个簇中心。
[0009]基于所有所述簇中心,构建中间图,其中,所述中间图为所述多层跳表的当前聚类图对应的上一层图。
[0010]将所述中间图作为当前聚类图,并返回所述对所述当前聚类图进行聚类处理,得到至少两个簇中心的步骤继续执行,直到所述中间图对应的层数达到预设层数时,得到多层跳表。
[0011]基于所述倒排文件系统和所述多层跳表,构建图像库。
[0012]为了解决上述技术问题,本申请实施例提供一种图像检索方法,包括以下步骤:获取待检索图像,并将所述待检索图像输入到图像库中。
[0013]对所述待检索图像进高维特征提取,得到待检索高维特征。
[0014]基于倒排文件系统,计算所述待检索高维特征与每一个倒排文件对应的关键字的
相似度,并根据计算得到的相似度结果,确定所述待检索高维特征对应的Top

k个簇。
[0015]针对所述Top

k个簇中的每一个簇,基于所述多层跳表,检索到与所述待检索高维特征距离最近的n个点,并将所述n个点作为候选点,其中,所述n为大于等于2的正整数。
[0016]将所有所述候选点对应的图像作为所述待检索图像的检索结果。
[0017]为了解决上述技术问题,本申请实施例还提供一种图像库构建装置,包括以下步骤:图像高维特征集合获取模块,用于获取图像高维特征集合。
[0018]簇获取模块,用于对所述图像高维特征集合中的所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇,其中,所述簇由点构成,所述点与所述高维特征一一对应。
[0019]倒排文件系统构建模块,用于基于所有所述簇,构建倒排文件系统。
[0020]完整图确定模块,用于针对每一个所述簇,对所述簇中的所有点进行边连接处理,得到所述簇对应的完整图,并将所有所述完整图作为当前聚类图,其中,所有所述完整图为多层跳表的最底层图,所述多层跳表包括N个层,每一个层对应一个图,所述N为大于等于2的正整数。
[0021]簇中心获取模块,用于对所述当前聚类图进行聚类处理,得到至少两个簇中心。
[0022]中间图确定模块,用于基于所有所述簇中心,构建中间图,其中,所述中间图为所述多层跳表的当前聚类图对应的上一层图。
[0023]多层跳表确定模块,用于将所述中间图作为当前聚类图,并返回所述对所述当前聚类图进行聚类处理,得到至少两个簇中心的步骤继续执行,直到所述中间图对应的层数达到预设层数时,得到多层跳表。
[0024]图像库构建模块,用于基于所述倒排文件系统和所述多层跳表,构建图像库。
[0025]为了解决上述技术问题,本申请实施例还提供一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述图像库构建方法的步骤。
[0026]为了解决上述技术问题,本申请实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述图像库构建方法的步骤。
[0027]本专利技术实施例提供的图像库构建方法、图像检索方法、装置、计算机设备及存储介质,通过获取图像高维特征集合;对所述图像高维特征集合中的所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇;基于所有所述簇,构建倒排文件系统;针对每一个所述簇,对所述簇中的所有点进行边连接处理,得到所述簇对应的完整图,并将所有所述完整图作为当前聚类图;对所述当前聚类图进行聚类处理,得到至少两个簇中心;基于所有所述簇中心,构建中间图;将所述中间图作为当前聚类图,并返回所述对所述当前聚类图进行聚类处理,得到至少两个簇中心的步骤继续执行,直到所述中间图对应的层数达到预设层数时,得到多层跳表;基于所述倒排文件系统和所述多层跳表,构建图像库。通过上述步骤构建倒排文件系统和多层跳表,结合倒排文件系统和多层跳表构建图像库。通过倒排文件系统实现在海量高维特征向量时,快速对图像进行检索,通过多层跳表保证了数据精度,从而提高了在存在海量高维特征向量时,对图像进行检索的准确率。
附图说明
[0028]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0029]图1是本申请可以应用于其中的示例性系统架构图。
[0030]图2是本申请的图像库构建方法的一个实施例的流程图。
[0031]图3是本申请的图像检索方法的一个实施例的流程图。
[0032]图4是本申请多层跳表的一示例图。
[0033]图5是根据本申请的图像库构建装置的一个实施例的结构示意图。
[0034]图6是根据本申请的计算机设备的一个实施例的结构示意图。
具体实施方式
[0035]除非另有定义,本文所使用的所有的技术和科学术语与属于本申请的
的技术人员通常理解的含义相同;本文中在申请的说明书中所使用的术语只是为了描述具体的实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像库构建方法,其特征在于,所述图像库构建方法包括:获取图像高维特征集合;对所述图像高维特征集合中的所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇,其中,所述簇由点构成,所述点与所述高维特征一一对应;基于所有所述簇,构建倒排文件系统;针对每一个所述簇,对所述簇中的所有点进行边连接处理,得到所述簇对应的完整图,并将所有所述完整图作为当前聚类图,其中,所有所述完整图为多层跳表的最底层图,所述多层跳表包括N个层,每一个层对应一个图,所述N为大于等于2的正整数;对所述当前聚类图进行聚类处理,得到至少两个簇中心;基于所有所述簇中心,构建中间图,其中,所述中间图为所述多层跳表的当前聚类图对应的上一层图;将所述中间图作为当前聚类图,并返回所述对所述当前聚类图进行聚类处理,得到至少两个簇中心的步骤继续执行,直到所述中间图对应的层数达到预设层数时,得到多层跳表;基于所述倒排文件系统和所述多层跳表,构建图像库。2.如权利要求1所述的图像库构建方法,其特征在于,所述获取图像高维特征集合的步骤包括:获取图像集合;基于预设的特征提取方式,对所述图像集合中的每一张图像进行高维特征提取,得到所述图像对应的高维特征;将所有所述图像对应的高维特征加入图像高维特征集合中,得到图像高维特征集合。3.如权利要求1所述的图像库构建方法,其特征在于,所述对所述图像高维特征集合中的所有高维特征进行聚类处理,直到损失函数收敛,得到至少两个簇的步骤包括:基于预设的簇中心选取方式,从所有高维特征中选取预设数量的高维特征作为簇中心,并基于所述簇中心,构建簇;针对每一个所述高维特征,计算所述高维特征与每一个所述簇对应的簇中心的距离,得到所述高维特征对应的距离结果;根据所述高维特征对应的距离结果,将所述高维特征划分到所述距离结果最小对应的簇中;在每一个所述簇中,重新选取预设数量的高维特征作为簇中心,并返回所述针对每一个所述高维特征,计算所述高维特征与每一个所述簇对应的簇中心的距离,得到所述高维特征对应的距离结果的步骤继续执行,直到损失函数收敛,得到至少两个簇。4.如权利要求1所述的图像库构建方法,其特征在于,所述基于所有所述簇,构建倒排文件系统的步骤包括:针对每一个簇,将所述簇对应的簇中心作为关键字,构建倒排文件,并将所述簇的所有点加入所述倒排文件中;基于所有所述倒排文件,确定倒排文件系统。5.如权利要求1所述的图像库构建方法,其特征在于,所述针对每一个所述簇,对所述簇中的所有点进行边连接处理,得到所述簇对应的完整图,并将所有所述完整图作为当前
聚类图的步骤包括:针对每一个所述簇中的任一点,计算所述点与所述簇的其他点的相似度,得到所述点对应的所有相似度结果;按照相似度从小到大的顺序,从所述点对应的所有相似度结果选取预设数量的相似度结果对应的点作为待连接点;将所述点与所有所述待连接点进行边连接处理,直到所述簇中所有点选取完毕,得到所述簇对应的完整图。6.一种图像检索方法,其特征在于,所述图像检索方法应用在权利要求1至5任一项构建的图像库上,所述图像检索方法包括:获取待检索图像,并将所述待检索图像输入到图像库中;对所述待检索图像进高维特征提取,得到待检索高维特征;基于倒排文件系统,计算所述待检索高维特征与每一个倒排文件对应的关键字的相似度,并根据计算得到...

【专利技术属性】
技术研发人员:刘伟华李林
申请(专利权)人:智慧眼科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1