对象查询的方法、电子设备及存储介质技术

技术编号:34966526 阅读:24 留言:0更新日期:2022-09-17 12:47
本申请提供了一种对象查询的方法、装置、电子设备及存储介质,依据本申请实施例,对目标对象进行特征提取;利用满足第一指定条件的哈希矩阵,根据提取出的目标对象的特征,得到目标对象的二值化表示;利用目标对象的二值化表示,查询与目标对象匹配的候选对象。相比于特征向量,二值化表示可以节省大量的存储资源,尤其当候选对象的数量是以亿为单位的情况下。基于二值化表示可以节省资源的前提,在将特征转换为二值化表示的过程中,可以无需对提取出的高维特征进行降维处理。即,二值化表示可以直接等价于高维特征,从而保障查询的精准性。性。性。

【技术实现步骤摘要】
对象查询的方法、电子设备及存储介质


[0001]本申请涉及数据处理
,尤其涉及一种对象查询的方法和装置、电子设备及存储介质。

技术介绍

[0002]目前在相似性查询场景下,通常是利用特征提取模型提取出目标对象的特征向量。进而可以基于目标对象的特征向量进行向量检索,以查询到与目标对象匹配的候选对象。
[0003]若目标对象的特征向量为高维时,特征向量的数据量较大。若以高维特征直接比较,会造成存储资源以及用于比较计算的计算资源的浪费。
[0004]另一种方式是将高维特征向量进行降维处理,从而降低数据量。但降维后的特征向量会存在信息丢失的情况,导致匹配结果无法满足预期。

技术实现思路

[0005]本申请实施例提供一种对象查询的方法和装置、电子设备及存储介质,以实现在保障查询准确率的前提下,节省存储资源以及计算资源。
[0006]第一方面,本申请实施例提供了一种对象查询的方法,包括:对目标对象进行特征提取;利用满足第一指定条件的哈希矩阵,根据提取出的目标对象的特征,得到目标对象的二值化表示;利用目标对象的二值化表示,查询与目标对象匹配的候选对象。
[0007]第二方面,本申请实施例提供了一种对象查询的装置,包括:特征提取模块,用于对目标对象进行特征提取;二值化表示生成模块,用于利用满足第一指定条件的哈希矩阵,根据提取出的目标对象的特征,得到目标对象的二值化表示;候选对象查询模块,用于利用目标对象的二值化表示,查询与目标对象匹配的候选对象。第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上的计算机程序,处理器在执行计算机程序时实现上述任一项的方法。
[0008]第四方面,本申请实施例提供了一种计算机可读存储介质,计算机可读存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述任一项的方法。
[0009]与现有技术相比,本申请具有如下优点:依据本申请实施例的方案,在进行候选对象的查询时,可以基于目标对象的二值化表示,以及预先已经确定出的每个候选对象的二值化表示进行。一方面,相比于特征向量,二值化表示可以节省大量的存储资源,尤其当候选对象的数量是以亿为单位的情况下。另一方面,在将特征转换为二值化表示的过程中,可以无需对提取出的高维特征进行降维
处理。即,二值化表示可以直接等价于高维特征,从而保障查询的精准性。
[0010]上述说明仅是本申请技术方案的概述 ,为了能够更清楚了解本申请的技术手段,可依照说明书的内容予以实施,并且为了让本申请的上述和其他目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0011]在附图中,除非另外规定,否则贯穿多个附图相同的附图标记表示相同或相似的部件或元素。这些附图不一定是按照比例绘制的。应该理解,这些附图仅描绘了根据本申请的一些实施方式,而不应将其视为是对本申请范围的限制。
[0012]图1为本申请提供的对象查询的方法的场景示意图;图2为本申请一实施例的对象查询的方法的流程图;图3是本申请一实施例的哈希矩阵计算的原理示意图;图4是本申请一实施例的得到目标对象的二值化表示的原理示意图;图5是本申请一实施例的掩膜提取示意图;图6是本申请一实施例的特征提取模型的训练示意图;图7是本申请一实施例的样本对等级分类示意图;图8是本申请一实施例的颜色相似度比较结果示意图;图9为本申请一实施例的对象查询的方法的原理示意图;图10为本申请一实施例的对象查询结果示意图;图11是本申请一实施例的对象查询的装置的结构框图;以及图12为用来实现本申请实施例的电子设备的框图。
具体实施方式
[0013]在下文中,仅简单地描述了某些示例性实施例。正如本领域技术人员可认识到的那样,在不脱离本申请的构思或范围的情况下,可通过各种不同方式修改所描述的实施例。因此,附图和描述被认为本质上是示例性的,而非限制性的。
[0014]为便于理解本申请实施例的技术方案,以下对本申请实施例的相关技术进行说明。以下相关技术作为可选方案与本申请实施例的技术方案可以进行任意结合,其均属于本申请实施例的保护范围。
[0015]首先对本申请所涉及的名词进行解释。
[0016]差异哈希算法(DHash):可以用于表征图像特征。将目标图像缩小为指定分辨率后,对指定分辨率的图像进行灰度值转换。比较每行左右两个相邻像素点的灰度值,若左侧像素点的灰度值大于右侧像素点,则记录为1,否则记录为0。以指定分辨率为9*8为示例,每行得到8位数值,共8行可以得到64位0

1数值序列。差异哈希算法又称为传统哈希算法。
[0017]深度哈希算法(DeepHash):深度哈希算法与差异哈希算法的相同点在于:都可用于表征图像特征。深度哈希算法与差异哈希算法的不同点在于:除了可以实现图像的哈希编码,还可以同时利用哈希编码实现图像的特征表示。例如,图像的特征表示可以是图像的语义特征、图像的标签特征等。
[0018]局部敏感哈希(LSH:Locality Sensitive Hashing):针对海量高维数据的快速最
近邻查找算法。局部敏感哈希是一种特殊的Hash函数,使得两个相似度很高的数据以较高的概率映射成同一个Hash值,两个相似度很低的数据以极低的概率映射成同一个Hash值。局部敏感哈希最通常的作用就是能高效处理海量高维数据的最近邻查找问题。
[0019]向量检索:基于用户输入的或者用户本身的特征,进行特征的距离计算(检索,召回和排序的抽象),返回结果的过程 。
[0020]卷积神经网络:(CNN:Convolutional Neural Network):可以通过分层网络获取不同维度的特征信息,并输出结果。
[0021]图1为示例性的用于实现本申请实施例的方法的一个应用场景的示意图。图1中示出的是利用目标图像在数据库中查询出与目标图像近似的两幅候选图像的场景。
[0022]执行查询过程的执行主体可以是智能手机、平板电脑等电子设备。电子设备接收到用户选择或输入的目标图像,可以利用预先训练好的模型得到目标图像的深度哈希值,该深度哈希值可以作为目标图像的图像指纹。
[0023]模型的训练数据可以包括经过添加水印、随机涂抹、随机剪裁、随机缩放、随机旋转、放射变换以及背景替换处理的图像正负样本。从而可以满足对于同款图像,模型确定出的图像指纹是相同的。
[0024]在数据库中可以预先存储有图像指纹与候选图像的关联关系。基于此,在得到候选图像的图像指纹的情况下,可以利用数据库排序算法实现对于候选图像的快速查询。数据库排序算法可以包括分组算法(GROUP BY)、连接算法(JOIN)等。例如图1所示,目标图像为模特穿着A型号服装采用第一姿势拍摄的图像。利用本申请实施例,可以查询到相同或不同的模特穿着不同颜色的A型号服装采用区别于第一姿势的其他姿势拍摄的图像。
[0025]以图像搜索为例,本申请实施例的方案可以应用于同款或近似款本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对象查询的方法,其特征在于,包括:对目标对象进行特征提取;利用满足第一指定条件的哈希矩阵,根据提取出的所述目标对象的特征,得到所述目标对象的二值化表示;利用所述目标对象的二值化表示,查询与所述目标对象匹配的候选对象。2.根据权利要求1所述的方法,其特征在于,所述利用满足第一指定条件的哈希矩阵,根据提取出的所述目标对象的特征,得到所述目标对象的二值化表示,包括:对提取出的所述对象的特征进行归一化处理,将所述归一化处理的结果映射至n维空间的球体表面;所述n为正整数;将映射至所述n维空间的球体表面的所述归一化处理的结果分别与所述满足第一指定条件的m个哈希矩阵进行计算,得到m位二值化表示;所述第一指定条件是利用所述球体的半径确定的;所述m为正整数;利用所述m位二值化表示,得到所述目标对象的二值化表示。3.根据权利要求1或2所述的方法,其特征在于,所述目标对象的确定方式,包括:确定噪声部分和所述目标对象的主体部分;将所述主体部分作为确定出的所述目标对象。4.根据权利要求3所述的方法,在所述目标对象为商品图像的情况下,所述确定噪声部分和所述目标对象的主体部分,包括:确定所述商品图像中所包含商品的掩膜;利用所述商品的掩膜,确定噪声部分和所述商品图像的主体部分。5.根据权利要求1所述的方法,其特征在于,所述特征提取是利用预先训练好的特征提取模型进行的;所述特征提取模型的训练过程,包括:利用第一样本集合,采用自监督学习对待训练的特征提取模型中的参数进行优化,得到第一优化结果;利用第二样本集合,采用有监督学习对所述待训练的特征提取模型中的参数进行优化,得到第二优化结果;在所述第一优化结果和所述第二优化结果中的至少一个满足第二指定条件的情况下,得到所述训练好的特征提取模型。6.根据权利要求5所述的方法,其特征在于,所述第二指定条件是根据指定类型的损失函数的收敛情...

【专利技术属性】
技术研发人员:田明哲张进
申请(专利权)人:阿里巴巴中国有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1