一种图片查重方法和系统技术方案

技术编号:24577781 阅读:27 留言:0更新日期:2020-06-21 00:37
本发明专利技术提供了一种图片查重方法和系统,涉及图像处理的技术领域,包括:获取多个待查重图片;按照预设尺寸,对多个待查重图片进行缩放处理,得到多个目标图片;确定每个目标图片的图片指纹;利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出第一目标图片和第二目标图片之间的汉明距离,其中,第一目标图片为目标图片中的任意一张图片,第二目标图片为目标图片中除第一目标图片以外的图片;根据汉明距离,确定第一目标图片是否为第二目标图片的重复图片,解决了现有技术中无法对大量图片进行查重的技术问题。

A method and system of image duplicate checking

【技术实现步骤摘要】
一种图片查重方法和系统
本专利技术涉及图像处理的
,尤其是涉及一种图像查重的方法和系统。
技术介绍
在大数据时代,每天甚至每小时每分钟互联网都产生和传播着海量的图片,在企业平台,特别是电商平台,商品山寨,图标仿冒十分严重。为解决这些问题,靠人工一张张图片去检测肯定是做不到的,只能建立一个图片查重系统在海量图片中自动化找出相似图片进而排查图标仿冒。而现有的图片查重技术中,往往耗时很久,无法针对海量图片的查重。针对上述问题,还未提出有效的解决方案。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种图片查重方法和系统,以缓解了解决了现有技术中无法对大量图片进行查重的技术问题。第一方面,本专利技术实施例提供了一种图片查重方法,包括:获取多个待查重图片;按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;确定每个所述目标图片的图片指纹;利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。进一步地,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。进一步地,确定每个所述目标图片的图片指纹,包括:对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;基于所述目标图片DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。进一步地,结合每个所述像素块所对应的系数和所述平均值,确定出所述待查重图片的图片指纹,包括:根据每个所述像素块所对应的系数和所述平均值,确定出所述n*m个像素块中的第一目标像素块,其中,所述第一目标像素块为所述n*m个像素块中系数大于或等于所述平均值的像素块;将所述第一目标像素块的哈希值标记为第一预设值,以及将第二目标像素块的哈希值标记为第二预设值,其中,所述第二目标像素块为所述n*m个像素块中除所述第一目标像素块以外的像素块;根据所述第一目标像素块的哈希值和所述第二目标像素块的哈希值,确定出所述目标图片的哈希值,并将所述哈希值确定为所述图片指纹。进一步地,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,包括:将所述第一目标图片的图片指纹均分为预设数量个第一子图片指纹,以及将所述第二目标图片的图片指纹均分为所述预设数量个第二子图片指纹;分别计算所述第一子图片指纹与每个所述第二目标图片的第二子图片指纹之间的汉明距离,得到多个汉明距离。进一步地,根据所述汉明距离,确定所述待查重图片是否为所述预设图片的重复图片,包括:确定所述多个汉明距离中是否包含目标汉明距离,其中,所述目标汉明距离为所述多个汉明距离中大于预设阈值的汉明距离;若所述多个汉明距离中包含目标汉明距离,则所述第一目标图片为所述第二目标图片的重复图片;若所述多个汉明距离中不包含目标汉明距离,则所述第一目标图片不是为所述第二目标图片的重复图片。第二方面,本专利技术实施例还提供了一种图片查重系统,包括:获取单元,缩放单元,第一确定单元,计算单元和第二确定单元,其中,所述获取单元,用于获取多个待查重图片;所述缩放单元,用于按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;所述第一确定单元,确定每个所述目标图片的图片指纹;所述计算单元,用于利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;所述第二确定单元,用于根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。进一步地,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。第三方面,本专利技术实施例还提供一种具有处理器可执行的非易失的程序代码的计算机可读介质,所述程序代码使所述处理器执行第一方面所述的图片查重方法。第四方面,本专利技术实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方面中所述的图片查重方法。在本专利技术实施例中,首先,获取多个待查重图片;并按照预设尺寸,对多个待查重图片进行缩放处理,得到多个目标图片;接着,确定每个目标图片的图片指纹;然后,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出第一目标图片和第二目标图片之间的汉明距离,其中,第一目标图片为目标图片中的任意一张图片,第二目标图片为目标图片中除第一目标图片以外的图片;最后根据汉明距离,确定第一目标图片是否为第二目标图片的重复图片。本专利技术实施例中,通过对多个待查重图片进行缩放,得到多个目标图片,确定出每个目标图片的图片指纹,最后利用各个目标图片的图片指纹之间的汉明距离,确定出多个待查重图片中是否包含重复的图片,从而达到了对大量图片进行查重的目的,进而无法对大量图片进行查重的技术问题,从而实现了能够快速准确地对大量图片进行查重的技术效果。本专利技术的其他特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术而了解。本专利技术的目的和其他优点在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种图片查重方法的流程图;图2为本专利技术实施例提供的一种目标图片的图片指纹的确定方法的流程图;图3为本专利技术实施例提供的一种汉明距离的计算方法的流程图;图4为本专利技术实施例提供的一种图片查重系统的示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合附图对本专利技术的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一:根据本专利技术实施例,提供了一种图片查重方法和系统的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计本文档来自技高网...

【技术保护点】
1.一种图片查重方法,其特征在于,包括:/n获取多个待查重图片;/n按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;/n确定每个所述目标图片的图片指纹;/n利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;/n根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。/n

【技术特征摘要】
1.一种图片查重方法,其特征在于,包括:
获取多个待查重图片;
按照预设尺寸,对所述多个待查重图片进行缩放处理,得到多个目标图片;
确定每个所述目标图片的图片指纹;
利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,其中,所述第一目标图片为所述目标图片中的任意一张图片,所述第二目标图片为所述目标图片中除所述第一目标图片以外的图片;
根据所述汉明距离,确定所述第一目标图片是否为所述第二目标图片的重复图片。


2.根据权利要求1所述的方法,其特征在于,所述预设尺寸为n*m,则所述目标图片中包含n*m个像素块,其中,n与m均为大于0的整数。


3.根据权利要求2所述的方法,其特征在于,确定每个所述目标图片的图片指纹,包括:
对所述目标图片进行灰度化处理,得到所述目标图片的灰度图;
对所述灰度图进行离散余弦变换,得到所述目标图片的DCT系数矩阵;
基于所述目标图片的DCT系数矩阵,确定出每个所述像素块所对应的系数,以及计算所述DCT系数矩阵的平均值;
结合每个所述像素块所对应的系数和所述平均值,确定出所述目标图片的图片指纹。


4.根据权利要求2所述的方法,其特征在于,结合每个所述像素块所对应的系数和所述平均值,确定出所述待查重图片的图片指纹,包括:
根据每个所述像素块所对应的系数和所述平均值,确定出所述n*m个像素块中的第一目标像素块,其中,所述第一目标像素块为所述n*m个像素块中系数大于或等于所述平均值的像素块;
将所述第一目标像素块的哈希值标记为第一预设值,以及将第二目标像素块的哈希值标记为第二预设值,其中,所述第二目标像素块为所述n*m个像素块中除所述第一目标像素块以外的像素块;
根据所述第一目标像素块的哈希值和所述第二目标像素块的哈希值,确定出所述目标图片的哈希值,并将所述哈希值确定为所述图片指纹。


5.根据权利要求4所述的方法,其特征在于,利用第一目标图片的图片指纹和第二目标图片的图片指纹,计算出所述第一目标图片和所述第二目标图片之间的汉明距离,包括:<...

【专利技术属性】
技术研发人员:杨嘉华
申请(专利权)人:广东三维家信息科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1