图片相似度比对方法和装置制造方法及图纸

技术编号:20075157 阅读:30 留言:0更新日期:2019-01-15 00:39
本公开提供了一种图片相似度比对方法和装置,涉及图像识别领域。该方法包括:提取待测图片和目标图片的全局信息,以及待测图片和目标图片的重点信息;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;若第二相似度大于第二阈值,则确定待测图片与目标图片相似。本公开在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。

Method and device of image similarity comparison

The present disclosure provides a method and device for image similarity comparison, which relates to the field of image recognition. The method includes: extracting the global information of the pictures to be tested and the target pictures, as well as the key information of the pictures to be tested and the target pictures; comparing the global information of the pictures to the global information of the target pictures to determine the first similarity; if the first similarity is greater than the first threshold, then comparing the key information of the pictures to determine the second similarity. If the second similarity is greater than the second threshold, it is determined that the image to be measured is similar to the target image. The present disclosure considers both the overall similarity and whether an image is similar by comparing the key information, thus taking into account the accuracy and recall rate of image similarity comparison, thereby improving the accuracy of image recognition.

【技术实现步骤摘要】
图片相似度比对方法和装置
本公开涉及图像识别领域,尤其涉及一种图片相似度比对方法和装置。
技术介绍
现有图片相似度比对,通常在准确率和召回率之间做适当的折衷。比如,在图片搜索领域,更看重其召回率,而在精确的图片比对领域,则更看重准确率。但是,实际上在图片相似度比对领域,对于准确率和召回率都有较高的要求。例如,比较同一本书的封面照片与网络上的图书封面照片是否相同,是否有版本变化导致的文字不同、封面重新设计等。要求一方面要识别很精细的不同,如文字内容的变化,但另一方面,要求过滤掉光照、反光、污损、尺寸设计不规范、贴有腰封及防伪标签等诸多噪音。前述的流行的图片比对方法能够过滤掉噪音的影响,将相同的一本书判定为“相同”,但无法识别精细的文字区别。而采用类似SiameseNetwork(孪生网络)等的深度学习方法,将两张图作为网络的差分输入,虽然能够达到精确识别文字区别的目的,却难以忽略过多的噪音影响。
技术实现思路
本公开要解决的一个技术问题是提供一种图片相似度比对方法和装置,能够兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。根据本公开一方面,提出一种图片相似度比对方法,包括:提取待测图片和目标图片的全局信息,以及待测图片和目标图片的重点信息;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;若第二相似度大于第二阈值,则确定待测图片与目标图片相似。可选地,提取待测图片和目标图片的重点信息包括:确定待测图片中的重点子图和目标图片中的重点子图;提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量;将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度包括:将待测图片的重点子图的特征向量,与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度。可选地,确定重点子图包括:确定待测图片和/或目标图片中重点内容所在区域;将重点内容所在区域对应的图像作为重点子图。可选地,重点内容为能够标志图片区分度的内容。可选地,基于光学文字识别算法和/或物体识别算法确定重点内容所在区域。可选地,确定待测图片的全局信息以及目标图片的重点信息包括:提取待测图片的特征向量以及目标图片的特征向量;将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度包括:将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。可选地,基于第一特性向量提取模型提取重点子图的特征向量。可选地,该方法还包括:对样本图片中的重点子图的特性向量进行标注生成第一标注文件;基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。可选地,基于第二特征向量提取模型提取待测图片和目标图片的特征向量。可选地,对样本图片的特性向量进行标注生成第二标注文件;基于样本图片和第二标注文件对第二特征向量提取模型进行训练。根据本公开的另一方面,还提出一种图片相似度比对装置,包括:全局信息提取单元,用于提取待测图片和目标图片的全局信息;重点信息提取单元,用于待测图片和目标图片的重点信息;全局信息比对单元,用于将待测图片的全局信息与目标图片的全局信息进行比对确定第一相似度;重点信息比对单元,用于若第一相似度大于第一阈值,则将待测图片的重点信息与目标图片的重点信息进行比对确定第二相似度;相似度确定单元,用于若第二相似度大于第二阈值,则确定待测图片与目标图片相似。可选地,重点信息提取单元用于确定待测图片中的重点子图和目标图片中的重点子图,提取待测图片的重点子图的特征向量以及目标图片的重点子图的特征向量;重点信息比对单元用于将待测图片的重点子图的特征向量与目标图片对应区域的重点子图的特征向量进行对比,确定第二相似度。可选地,重点信息提取单元还用于确定待测图片和/或目标图片中重点内容所在区域,将重点内容所在区域对应的图像作为重点子图。可选地,重点内容为能够标志图片区分度的内容。可选地,重点信息提取单元用于基于光学文字识别算法和/或物体识别算法确定重点内容所在区域。可选地,全局信息提取单元用于提取待测图片的特征向量以及目标图片的特征向量;全局信息比对单元用于将待测图片的特征向量与目标图片的特征向量进行比对确定第一相似度。可选地,重点信息提取单元还用于基于第一特性向量提取模型提取重点子图的特征向量。可选地,该装置还包括:第一特性向量提取模型训练单元,用于对样本图片中的重点子图的特性向量进行标注生成第一标注文件,基于样本图片的重点子图和第一标注文件对第一特征向量提取模型进行训练。可选地,全局信息提取单元还用于基于第二特征向量提取模型提取待测图片和目标图片的特征向量。可选地,该装置还包括:第二特征向量提取模型训练单元,用于对样本图片的特性向量进行标注生成第二标注文件,基于样本图片和第二标注文件对第二特征向量提取模型进行训练。根据本公开的另一方面,还提出一种图片相似度比对装置,包括:存储器;以及耦接至存储器的处理器,处理器被配置为基于存储在存储器的指令执行如上述的图片相似度对比方法。根据本公开的另一方面,还提出一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现上述的图片相似度对比方法的步骤。与现有技术相比,本公开实施例在兼顾整体相似度的同时,能够通过比对重点信息来判别图片是否为相似图片,从而兼顾图片相似度比对的准确率和召回率,进而提高了图片识别的准确性。通过以下参照附图对本公开的示例性实施例的详细描述,本公开的其它特征及其优点将会变得清楚。附图说明构成说明书的一部分的附图描述了本公开的实施例,并且连同说明书一起用于解释本公开的原理。参照附图,根据下面的详细描述,可以更加清楚地理解本公开,其中:图1为本公开图片相似度比对方法的一个实施例的流程示意图。图2为本公开图片相似度比对方法的另一个实施例的流程示意图。图3为本公开图片相似度比对方法的再一个实施例的流程示意图。图4为本公开图片相似度比对装置一个实施例的结构示意图。图5为本公开图片相似度比对装置另一个实施例的结构示意图。图6为本公开图片相似度比对装置再一个实施例的结构示意图。图7为本公开图片相似度比对装置又一个实施例的结构示意图。具体实施方式现在将参照附图来详细描述本公开的各种示例性实施例。应注意到:除非另外具体说明,否则在这些实施例中阐述的部件和步骤的相对布置、数字表达式和数值不限制本公开的范围。同时,应当明白,为了便于描述,附图中所示出的各个部分的尺寸并不是按照实际的比例关系绘制的。以下对至少一个示例性实施例的描述实际上仅仅是说明性的,决不作为对本公开及其应用或使用的任何限制。对于相关领域普通技术人员已知的技术、方法和设备可能不作详细讨论,但在适当情况下,所述技术、方法和设备应当被视为授权说明书的一部分。在这里示出和讨论的所有示例中,任何具体值应被解释为仅仅是示例性的,而不是作为限制。因此,示例性实施例的其它示例可以具有不同的值。应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步讨论。为使本公开的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本公开进一步详细本文档来自技高网...

【技术保护点】
1.一种图片相似度比对方法,包括:提取待测图片和目标图片的全局信息,以及所述待测图片和所述目标图片的重点信息;将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度;若所述第一相似度大于第一阈值,则将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度;若所述第二相似度大于第二阈值,则确定所述待测图片与所述目标图片相似。

【技术特征摘要】
1.一种图片相似度比对方法,包括:提取待测图片和目标图片的全局信息,以及所述待测图片和所述目标图片的重点信息;将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度;若所述第一相似度大于第一阈值,则将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度;若所述第二相似度大于第二阈值,则确定所述待测图片与所述目标图片相似。2.根据权利要求1所述的图片相似度比对方法,其中,提取所述待测图片和所述目标图片的重点信息包括:确定所述待测图片中的重点子图和所述目标图片中的重点子图;提取所述待测图片的重点子图的特征向量以及所述目标图片的重点子图的特征向量;将所述待测图片的重点信息与所述目标图片的重点信息进行比对确定第二相似度包括:将所述待测图片的重点子图的特征向量,与所述目标图片对应区域的重点子图的特征向量进行对比,确定所述第二相似度。3.根据权利要求2所述的图片相似度比对方法,其中,确定重点子图包括:确定所述待测图片和/或所述目标图片中重点内容所在区域;将所述重点内容所在区域对应的图像作为所述重点子图。4.根据权利要求3所述的图片相似度比对方法,其中,所述重点内容为能够标志图片区分度的内容。5.根据权利要求3所述的图片相似度比对方法,其中,基于光学文字识别算法和/或物体识别算法确定所述重点内容所在区域。6.根据权利要求2所述的图片相似度比对方法,其中,确定待测图片的全局信息以及目标图片的重点信息包括:提取所述待测图片的特征向量以及所述目标图片的特征向量;将所述待测图片的全局信息与所述目标图片的全局信息进行比对确定第一相似度包括:将所述待测图片的特征向量与所述目标图片的特征向量进行比对确定所述第一相似度。7.根据权利要求2-5任一所述的图片相似度对比方法,其中,基于第一特性向量提取模型提取所述重点子图的特征向量。8.根据权利要求7所述的图片相似度对比方法,还包括:对样本图片中的重点子图的特性向量进行标注生成第一标注文件;基于所述样本图片的重点子图和所述第一标注文件对所述第一特征向量提取模型进行训练。9.根据权利要求6所述的图片相似度对比方法,其中,基于第二特征向量提取模型提取所述待测图片和所述目标图片的特征向量。10.根据权利要求9所述的图片相似度对比方法,还包括:对样本图片的特性向量进行标注生成第二标注文件;基于所述样本图片和所述第二标注文件对所述第二特征向量提取模型进行训练。11.一种图片相似度比对装置,包括:全局信息提取单元,用于提取待测图片和目标图片的全局信息;重点信息提取单元,用于所述待测图片和所述目标图片的重点信息;全局信息比对单元,用于将所述待测图片的全局信息与所述目标图片的全局信息...

【专利技术属性】
技术研发人员:周佩明汪振华李旭峰梅涛周伯文
申请(专利权)人:北京京东尚科信息技术有限公司北京京东世纪贸易有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1