一种相似图像搜索方法、设备及存储介质技术

技术编号:39176087 阅读:8 留言:0更新日期:2023-10-27 08:24
本申请公开一种相似图像搜索方法、设备及存储介质,该方法包括:获取待搜索图像,提取待搜索图像的图像特征得到待搜索图像的K维特征向量;对待搜索图像的K维特征向量进行降维,得到待搜索图像的Q维特征向量;基于随机生成的P个K维随机向量对待搜索图像的K维特征向量进行处理,得到待搜索图像的第一哈希码;确定预设哈希码集合中存在第一哈希码的情况下,根据待搜索图像的第一哈希码和Q维特征向量,在N个从节点对应的树上并行搜索到与待搜索图像相似的目标样本图像;从节点上建立了多个树,不同树是基于不同哈希码对应的样本图像的Q维特征向量建立的。征向量建立的。征向量建立的。

【技术实现步骤摘要】
一种相似图像搜索方法、设备及存储介质


[0001]本申请涉及图像处理技术,尤其涉及一种相似图像搜索方法、设备及存储介质。

技术介绍

[0002]目前的相似图像搜索方法,是逐一比较待搜索图像的特征向量与图像库中的各个原始图像的特征向量之间的相似度,以确定待搜索图像对应的相似图像,这种搜索方式工作量大,导致搜索时间长,搜索效率差。

技术实现思路

[0003]本申请期望提供一种相似图像搜索方法、设备及存储介质。
[0004]本申请的技术方案是这样实现的:
[0005]第一方面,提供了一种相似图像搜索方法,应用于主节点,所述方法包括:
[0006]获取待搜索图像,提取所述待搜索图像的图像特征得到所述待搜索图像的K维特征向量;
[0007]对所述待搜索图像的K维特征向量进行降维,得到所述待搜索图像的Q维特征向量;K>Q;
[0008]基于随机生成的P个K维随机向量对所述待搜索图像的K维特征向量进行处理,得到所述待搜索图像的第一哈希码;
[0009]确定预设哈希码集合中存在所述第一哈希码的情况下,根据所述待搜索图像的第一哈希码和Q维特征向量,在N个从节点对应的树上并行搜索到与所述待搜索图像相似的目标样本图像;其中,所述从节点上建立了多个树,不同树是基于不同哈希码对应的样本图像的Q维特征向量建立的。
[0010]第二方面,提供了一种相似图像搜索装置,应用于主节点,所述装置包括:
[0011]提取单元,用于获取待搜索图像,提取所述待搜索图像的图像特征得到所述待搜索图像的K维特征向量;
[0012]处理单元,用于对所述待搜索图像的K维特征向量进行降维,得到所述待搜索图像的Q维特征向量;K>Q;
[0013]以及用于基于随机生成的P个K维随机向量对所述待搜索图像的K维特征向量进行处理,得到所述待搜索图像的第一哈希码;
[0014]以及用于确定预设哈希码集合中存在所述第一哈希码的情况下,根据所述待搜索图像的第一哈希码和Q维特征向量,在N个从节点对应的树上并行搜索到与所述待搜索图像相似的目标样本图像;其中,所述从节点上建立了多个树,不同树是基于不同哈希码对应的样本图像的Q维特征向量建立的。
[0015]第三方面,提供了一种电子设备,包括:处理器和配置为存储能够在处理器上运行的计算机程序的存储器,其中,所述处理器配置为运行所述计算机程序时,执行第一方面的方法的步骤。
[0016]第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,其中,该计算机程序被处理器执行时实现第一方面的方法的步骤。
[0017]本申请公开一种相似图像搜索方法、设备及存储介质,本申请使用一主节点N个从节点系统架构,且分别在N个从节点上基于不同哈希码对应的样本图像的Q维特征向量建立了树结构;同一哈希码指示的全部图像是相似的;因此,进行相似图像搜索时,先通过待搜索图像的第一哈希码,分别在N个从节点上找到第一哈希码对应的树,树上全部Q维特征向量指示的全部样本图像与待搜索图像是相似的,从这些相似的样本图像中能够快速找到与待搜索图像相似度高的目标样本图像。本申请这种搜索方式使得实际搜索数据量大大减少,即缩短了搜索时长,提高了搜索效率。
附图说明
[0018]图1为本申请实施例中相似图像搜索方法的第一流程示意图;
[0019]图2为本申请实施例中相似图像搜索方法的第二流程示意图;
[0020]图3为本申请实施例中相似图像搜索方法的第三流程示意图;
[0021]图4为本申请实施例中相似图像搜索方法的第四流程示意图;
[0022]图5为本申请实施例中相似图像搜索装置组成结构的示意图;
[0023]图6为本申请实施例中电子设备组成结构的示意图。
具体实施方式
[0024]为了能够更加详尽地了解本申请实施例的特点与
技术实现思路
,下面结合附图对本申请实施例的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本申请实施例。
[0025]本申请实施例提供了一种相似图像搜索方法,图1为本申请实施例中相似图像搜索方法的第一流程示意图,本申请实施例使用主从架构,逻辑架构上为一主多从,假设共有N个从节点,主、从节点都应该部署为集群,以集群的形式构成主、从节点,保持高可用特点。
[0026]下面以主节点为执行主体进行说明,如图1所示,该相似图像搜索方法具体可以包括:
[0027]步骤101:获取待搜索图像,提取待搜索图像的图像特征得到待搜索图像的K维特征向量。
[0028]本申请实施例中,通过终端上的摄像头对待搜索场景进行拍摄,以获取到待搜索图像;或者,从相册中获取预存的图像作为待搜索图像等等。
[0029]在一些实施例中,所述提取所述待搜索图像的图像特征得到所述待搜索图像的K维特征向量,包括:
[0030]将所述待搜索图像输入训练好的分类模型,记录所述训练好的分类模型中倒数第二层全连接层的数值,作为所述待搜索图像的K维特征向量。
[0031]这里,将训练好的分类模型中倒数第二层全连接层的数值,作为待搜索图像的特征向量,假设训练好的分类模型中倒数第二层全连接层的节点个数为K,即待搜索图像的特征向量为K维。
[0032]需要说明的是,本申请实施例中之所以选定倒数第二层全连接层的数值来表示待搜索图像的图像特征,是因为最后一层全连接层的节点个数通常等于分类数,个数较少,难
以表示图像特征。
[0033]本申请实施例的相似图像搜索方法的应用领域至少包括皮肤病治疗领域、商品推荐领域,这里不做具体限定。
[0034]这里,训练好的分类模型是根据M个样本图像训练预设分类模型得到。示例性的,对已经收集到的M个样本图像的面部痤疮数据集进行医学上的数据标注,即借助专业医生的知识标注病灶的种类,标注完成后建立卷积神经网络,训练对应计算机视觉的分类任务。如使用ResNet等常见的分类神经网络,加载预设分类模型,训练面部痤疮的分类。当损失下降到一定精度后,停止训练,得到训练好的分类模型。
[0035]步骤102:对待搜索图像的K维特征向量进行降维,得到待搜索图像的Q维特征向量;K>Q。
[0036]示例性的,可以使用主成分分析(Principal Components Analysis,PCA)对待搜索图像的K维特征向量进行降维。这里,PCA主要目的是用于降维,即原数据通过矩阵的线性变换,在尽可能保留原数据的前提下,减少数据的维度。
[0037]在一些实施例中,步骤102具体包括:获取K行Q列变换矩阵;
[0038]将所述待搜索图像的K维特征向量与所述K行Q列变换矩阵相乘,得到所述待搜索图像的Q维特征向量。
[0039]也就是说,利用K行Q列变换矩阵对待搜索图像的K维特征向量进行线性变换,得到待搜索图像的Q维特征向量。
[0040]在一些实施例中,所述获取K行Q列变换矩阵,包括:
[0041]提取M个样本图像的图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种相似图像搜索方法,应用于主节点,其特征在于,所述方法包括:获取待搜索图像,提取所述待搜索图像的图像特征得到所述待搜索图像的K维特征向量;对所述待搜索图像的K维特征向量进行降维,得到所述待搜索图像的Q维特征向量;K>Q;基于随机生成的P个K维随机向量对所述待搜索图像的K维特征向量进行处理,得到所述待搜索图像的第一哈希码;确定预设哈希码集合中存在所述第一哈希码的情况下,根据所述待搜索图像的第一哈希码和Q维特征向量,在N个从节点对应的树上并行搜索到与所述待搜索图像相似的目标样本图像;其中,所述从节点上建立了多个树,不同树是基于不同哈希码对应的样本图像的Q维特征向量建立的。2.根据权利要求1所述的方法,其特征在于,所述基于随机生成的P个K维随机向量对所述待搜索图像的K维特征向量进行处理,得到所述待搜索图像的第一哈希码,包括:将所述待搜索图像的K维特征向量与所述P个K维随机向量进行内积,得到一行P列的向量;按照不同列的预设编号规则对不同列的内积结果进行编号,得到所述待搜索图像的第一哈希码。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:提取M个样本图像的图像特征,得到所述M个样本图像的K维特征向量;将所述M个样本图像的K维特征向量与所述P个K维随机向量进行内积,得到M行P列的矩阵;确定出所述矩阵的第j列的最小值和最大值;j取为1至P的整数;将所述第j列的最小值和最大值之间划分第二预设数量个区间,并对所述第j列的M个内积结果进行编号;基于所述第j列的编号结果确定所述第j列对应的预设编号规则。4.根据权利要求3所述的方法,其特征在于,所述对所述第j列的M个内积结果进行编号之后,所述方法还包括:将所述矩阵的第i行的P个内积结果对应的编号进行拼接,得到第i个样本图像的哈希码;i取为1至M的整数;获取M个样本图像的哈希码,对所述M个样本图像的哈希码进行无放回随机抽样;将抽取的哈希码存储在所述预设哈希码集合中,直至所述预设哈希码集合中存储了第三预设数量的不重复的哈希码;其中,所述第三预设数量为哈希码总数量的预设倍数。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述预设哈希码集合中不存在所述第一哈希码的情况下,根据所述待搜索图像的第一哈希码和Q维特征向量,在所述N个从节点对应的硬盘中搜索到与所述待搜索图像相似的目标样本图像;其中,所述硬盘中存储了不同哈希码对应的不同文件,不同文件中存储...

【专利技术属性】
技术研发人员:胡冉杰王瑶唐晓霁王旭浩袁磊黄承基柳岸
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1