图像去重方法及系统技术方案

技术编号:14399257 阅读:48 留言:0更新日期:2017-01-11 12:34
本发明专利技术公开了一种图像去重方法及系统,图像去重方法包括以下步骤:S1、对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内;S2、利用图像局部二值特征计算所述两张图像之间的重复度;S3、判断所述两张图像是否重复,并在判断为是时,执行步骤S4;S4、比较所述两张图像的质量,并去除质量低的图像。本发明专利技术融合了图像的局部信息和全局信息来进行重复图像判定,令不同图像信息之间优势互补,使得图像去重的速度、去重的效果以及完整性都得到较好的保障。

【技术实现步骤摘要】

本专利技术涉及一种图像处理领域,特别是涉及一种图像去重方法及系统
技术介绍
图像包含了丰富且直观的信息,当前在互联网的社交、购物、旅游等领域,都需要大量的图像来给用户传递信息。随着图像数量的不断增加,其中重复图像的数量也越来越多。因此,图像信息的提供方在使用图像信息前,需要对图像进行去重,避免出现重复的图像,影响用户的体验,又增加自身图像的维护量。随着互联网的飞速发展,图像提供方每天都会利用用户上传、爬虫下载等诸多途径获取大量图像信息,数量已远远超过人工审核的限度。因此,利用计算机审核图像信息,自动对其中重复的图像进行判定和去除成为了迫切的需求。近年来出现了很多图像去重方法,如基于颜色和纹理等全局特征的一系列方法和基于SIFT(尺度不变特征变换)和ORB(一种图像二值特征点提取算法)等局部特征点的一系列方法等。这些方法中,基于全局特征的方法不能很好解决图像残缺和旋转等问题;基于SIFT等局部特征点的方法虽然效果较好,但是由于特征提取和匹配复杂,计算速度过于缓慢;基于ORB等局部二值特征点的方法,计算速度虽然很快,但是处理图像尺寸差异过大、形变和模糊等问题的效果较差。同时,现有方法大都被用于计算图像之间的重复度或判定图像是否重复,忽略了最后的重复图像去除环节,导致图像去重过程往往是不完整的。
技术实现思路
本专利技术要解决的技术问题是为了克服现有技术中图像去重方法存在很多问题的缺陷,提供一种实用性强、去重速度、效果和完整性俱佳的图像去重方法及系统。本专利技术是通过下述技术方案来解决上述技术问题的:本专利技术提供了一种图像去重方法,其特点在于,包括以下步骤:S1、对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内S2、利用图像局部二值特征计算所述两张图像之间的重复度;S3、判断所述两张图像是否重复,并在判断为是时,执行步骤S4;S4、比较所述两张图像的质量,并去除质量低的图像。较佳地,步骤S2包括:S21、分别从所述两张图像中提取图像局部二值特征点;S22、统计所述两张图像中的第一张图像中的匹配特征点的数量,所述匹配特征点与所述两张图像中的第二张图像中的一个特征点相匹配;S23、计算所述两张图像之间的重复度。较佳地,步骤S21中利用ORB算法提取图像局部二值特征点。较佳地,步骤S22包括:S221、从所述第一张图像中选取一目标特征点;S222、遍历所述第二张图像中的所有特征点,并分别计算所述第二张图像中的每个特征点与所述目标特征点之间的汉明距离;S223、从所述第二张图像中选取汉明距离最小的一第一特征点和汉明距离第二小的一第二特征点;S224、计算第一汉明距离与第二汉明距离之间的比值,所述第一汉明距离为所述第一特征点与所述目标特征点之间的汉明距离,所述第二汉明距离为所述第二特征点与所述目标特征点之间的汉明距离;S225、判断第一汉明距离与第二汉明距离之间的比值是否小于第一阈值,若是,则确定所述目标特征点为与所述第一特征点相匹配的匹配特征点,若否,则确定所述目标特征点与所述第一特征点不匹配;重复执行步骤S221-S225,直至所述第一张图像中的所有特征点均被选取,然后统计所述第一张图像中的匹配特征点的数量;步骤S23中计算所述两张图像之间的重复度包括:计算所述第一张图像中匹配特征点的数量与所述第一张图像中的特征点的总数之间的比值。较佳地,步骤S3包括:S31、设置第一重复度阈值和第二重复度阈值,所述第一重复度阈值大于所述第二重复度阈值;S32、将所述两张图像之间的重复度与所述第一重复度阈值及所述第二重复度阈值进行比较,若所述重复度大于或等于所述第一重复度阈值,则确定所述两张图像重复,然后执行步骤S4;若所述重复度小于或等于所述第二重复度阈值,则确定所述两张图像不重复,然后结束流程;若所述重复度大于所述第二重复度阈值且小于所述第一重复度阈值,则执行步骤S33;S33、获取所述两张图像的颜色特征和纹理特征,并将所述颜色特征和所述纹理特征组合为全局特征,计算所述两张图像的全局特征之间的曼哈顿距离;S34、判断所述曼哈顿距离是否小于一距离阈值,若是,则确定所述两张图像重复,然后执行步骤S4,若否,则确定所述两张图像不重复,然后结束流程。较佳地,步骤S4包括:S41、对所述两张图像进行拉普拉斯滤波,并计算滤波后的图像的像素值的方差;S42、确定像素值的方差小的图像为质量低的图像,并去除质量低的图像。较佳地,步骤S1之前还包括:S01、计算两张图像的像素值,并判断像素值是否相同,若是,则从所述两张图像中随机去除一张图像,然后结束流程,若否,则执行步骤S1。本专利技术的目的在于还提供了一种图像去重系统,其特点在于,包括:处理模块,用于对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内;重复度计算模块,用于利用图像局部二值特征计算所述两张图像之间的重复度;判断模块,用于判断所述两张图像是否重复,并在判断为是时,调用一去重模块;所述去重模块用于比较所述两张图像的质量,并去除质量低的图像。较佳地,所述重复度计算模块包括:特征点提取单元,用于分别从所述两张图像中提取图像局部二值特征点;特征点统计单元,用于统计所述两张图像中的第一张图像中的匹配特征点的数量,所述匹配特征点与所述两张图像中的第二张图像中的一个特征点相匹配;重复度计算单元,用于计算所述两张图像之间的重复度。较佳地,所述特征点提取单元用于利用ORB算法提取图像局部二值特征点。较佳地,所述特征点统计单元包括:第一选取子单元,用于从所述第一张图像中选取一目标特征点;遍历子单元,用于遍历所述第二张图像中的所有特征点,并分别计算所述第二张图像中的每个特征点与所述目标特征点之间的汉明距离;第二选取子单元,用于从所述第二张图像中选取汉明距离最小的一第一特征点和汉明距离第二小的一第二特征点;比值计算子单元,用于计算第一汉明距离与第二汉明距离之间的比值,所述第一汉明距离为所述第一特征点与所述目标特征点之间的汉明距离,所述第二汉明距离为所述第二特征点与所述目标特征点之间的汉明距离;比值判断子单元,用于判断第一汉明距离与第二汉明距离之间的比值是否小于第一阈值,若是,则确定所述目标特征点为与所述第一特征点相匹配的匹配特征点,若否,则确定所述目标特征点与所述第一特征点不匹配;统计子单元,用于重复调用所述第一选取子单元、所述遍历子单元、所述第二选取子单元、所述比值计算子单元及所述比值判断子单元,直至所述第一张图像中的所有特征点均被选取,然后统计所述第一张图像中的匹配特征点的数量;所述重复度计算单元用于计算所述第一张图像中匹配特征点的数量与所述第一张图像中的特征点的总数之间的比值。较佳地,所述判断模块包括:设置单元,用于设置第一重复度阈值和第二重复度阈值,所述第一重复度阈值大于所述第二重复度阈值;比较单元,用于将所述两张图像之间的重复度与所述第一重复度阈值及所述第二重复度阈值进行比较,若所述重复度大于或等于所述第一重复度阈值,则确定所述两张图像重复,然后调用所述去重模块;若所述重复度小于或等于所述第二重复度阈值,则确定所述两张图像不重复,然后不做操作;若所述重复度大于所述第二重复度阈值且小于所述第一重复度阈值,则调用一获取单元;所述获取单元用于本文档来自技高网...
图像去重方法及系统

【技术保护点】
一种图像去重方法,其特征在于,包括以下步骤:S1、对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内;S2、利用图像局部二值特征计算所述两张图像之间的重复度;S3、判断所述两张图像是否重复,并在判断为是时,执行步骤S4;S4、比较所述两张图像的质量,并去除质量低的图像。

【技术特征摘要】
1.一种图像去重方法,其特征在于,包括以下步骤:S1、对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内;S2、利用图像局部二值特征计算所述两张图像之间的重复度;S3、判断所述两张图像是否重复,并在判断为是时,执行步骤S4;S4、比较所述两张图像的质量,并去除质量低的图像。2.如权利要求1所述的图像去重方法,其特征在于,步骤S2包括:S21、分别从所述两张图像中提取图像局部二值特征点;S22、统计所述两张图像中的第一张图像中的匹配特征点的数量,所述匹配特征点与所述两张图像中的第二张图像中的一个特征点相匹配;S23、计算所述两张图像之间的重复度。3.如权利要求2所述的图像去重方法,其特征在于,步骤S21中利用ORB算法提取图像局部二值特征点。4.如权利要求2所述的图像去重方法,其特征在于,步骤S22包括:S221、从所述第一张图像中选取一目标特征点;S222、遍历所述第二张图像中的所有特征点,并分别计算所述第二张图像中的每个特征点与所述目标特征点之间的汉明距离;S223、从所述第二张图像中选取汉明距离最小的一第一特征点和汉明距离第二小的一第二特征点;S224、计算第一汉明距离与第二汉明距离之间的比值,所述第一汉明距离为所述第一特征点与所述目标特征点之间的汉明距离,所述第二汉明距离为所述第二特征点与所述目标特征点之间的汉明距离;S225、判断第一汉明距离与第二汉明距离之间的比值是否小于第一阈值,若是,则确定所述目标特征点为与所述第一特征点相匹配的匹配特征点,若否,则确定所述目标特征点与所述第一特征点不匹配;重复执行步骤S221-S225,直至所述第一张图像中的所有特征点均被选取,然后统计所述第一张图像中的匹配特征点的数量;步骤S23中计算所述两张图像之间的重复度包括:计算所述第一张图像中匹配特征点的数量与所述第一张图像中的特征点的总数之间的比值。5.如权利要求1所述的图像去重方法,其特征在于,步骤S3包括:S31、设置第一重复度阈值和第二重复度阈值,所述第一重复度阈值大于所述第二重复度阈值;S32、将所述两张图像之间的重复度与所述第一重复度阈值及所述第二重复度阈值进行比较,若所述重复度大于或等于所述第一重复度阈值,则确定所述两张图像重复,然后执行步骤S4;若所述重复度小于或等于所述第二重复度阈值,则确定所述两张图像不重复,然后结束流程;若所述重复度大于所述第二重复度阈值且小于所述第一重复度阈值,则执行步骤S33;S33、获取所述两张图像的颜色特征和纹理特征,并将所述颜色特征和所述纹理特征组合为全局特征,计算所述两张图像的全局特征之间的曼哈顿距离;S34、判断所述曼哈顿距离是否小于一距离阈值,若是,则确定所述两张图像重复,然后执行步骤S4,若否,则确定所述两张图像不重复,然后结束流程。6.如权利要求1所述的图像去重方法,其特征在于,步骤S4包括:S41、对所述两张图像进行拉普拉斯滤波,并计算滤波后的图像的像素值的方差;S42、确定像素值的方差小的图像为质量低的图像,并去除质量低的图像。7.如权利要求1-6中任意一项所述的图像去重方法,其特征在于,步骤S1之前还包括:S01、计算两张图像的像素值,并判断像素值是否相同,若是,则从所述两张图像中随机去除一张图像,然后结束流程,若否,则执行步骤S1。8.一种图像去重系统,其特征在于,包括:处理模块,用于对两张图像进行灰度化处理,并将所述两张图像按照初始的宽高比例缩放至一标准尺寸之内;重复度计算...

【专利技术属性】
技术研发人员:李翔
申请(专利权)人:携程计算机技术上海有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1