基于内容的复制图像检测方法技术

技术编号:4038427 阅读:288 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种基于内容的复制图像检测方法。现有的方法处理速度慢、无法处理大规模的图像库。本发明专利技术方法步骤首先将输入图像进行预处理操作;其次对预处理后的图像计算图像中每个像素的哈希值,根据获得的像素哈希值计算图像的相似哈希值;然后根据获得的图像相似哈希值检索图像数据表,确定图像数据表中有无复制图像;最后更新图像数据表,将输入图像的相似哈希值添加到图像数据表,等待下一个输入图像。本发明专利技术方法处理速度快,能够适应图像变换带来的影响。

【技术实现步骤摘要】

本专利技术属于计算机图像检索领域,涉及一种从图像库中快速检测复制图像的方法。
技术介绍
随着数码拍摄设备的普及,数字图像已经成为重要的信息存储和传递的媒介,同 时数字图像也越来越多地被发布到互联网上。在海量网络图像数据的检索过程中,如何在 返回的检索结果集中去除复制的或者相似的图像来提高检索的有效性具有重要的实际意 义。在个人电脑系统中,快速的图像复制检测系统有助于整理个人计算机中的大量图像,去 除不需要的重复图像,节省存储资源。另外,在很多实际应用中制作的图像具有商业用途, 并受版权保护,该类图像是被禁止随意拷贝和发布的。快速的复制图像检测技术对保护图 像的版权具有实际的应用价值。近年来,已有一些研究机构和个人开展了这方面的研究工作,提出了一些方法。在 图像版权保护方面,主要采用嵌入式复制检测技术,其主要将特定意义的标记(水印),利 用数字嵌入的方法隐藏在数字图像中。其目的在于检测盗版行为时,可以从数字图像中提 取这些信息,从而证明原作者对作品的所有权。数字水印技术主要用于证明原作者对图像 的版权,不适用于从大规模图像库中检索可能存在侵权的图像。另一种图像复制检测的技术是采用数字签名方法。数字签名方法是从图像中提取 不变特征,然后生成摘要,并将摘要与图像捆绑在一起。最为常用数字签名方法是根据图像 内容生成Md5值,并将Md5值作为图像的签名。该类方法不能应对图像变换的影响。只要 对原图稍作修改,重新生成的图像就会有不同的Md5值。所以该方法无法检测相似图像。另外一种方法是采用基于内容的图像复制检测方法,本专利技术属于该类方法。该类 方法根据图像的内容生成一个指纹来检测待测图像是否为原图像的拷贝。已有的方法都采 用高维向量作为图像的指纹,其在检测过程中,需要将待测图像的指纹与图像库中的图像 指纹计算相似距离。随着图像库中图像的增大,其性能急剧下降,所以其在大规模图像库 中,性能较差。
技术实现思路
本专利技术针对现有技术的不足,提供了一种。本专利技术方法的具体步骤为步骤(1)将输入图像进行预处理操作;所述的预处理操作是进行输入图像归一化 操作,即将输入图像缩小或放大到设定的尺寸。步骤(2)对预处理后的图像计算图像中每个像素的哈希值;所述的像素的哈希值 是根据图像中像素的颜色值和相邻像素的颜色值来确定的。步骤(3)根据获得的像素哈希值计算图像的相似哈希值(SimHash)。所述的 SimHash计算为成熟的算法,该算法中的每个像素的哈希值权重weight由像素在图像中的位置权重P和该像素与相邻像素的最大颜色差权重c决定,即weight = p+c ;如果像素位 置(x,y)符合下述条件Width/4 < X < width X 3/4 且 Height/4 < y < height X 3/4 则 p = 2 ;否则 p = 1 ;如果该像素与相邻像素的最大颜色差大于阈值,则c = 2,否则c = 1。其中width 和height为图像的宽和高。步骤(4)根据获得的图像SimHash检索图像数据表,如果该图像SimHash与数据 表中图像A的SimHash的汉明距离小于设定的值,则图像A为该图像的复制图像;如果该图 像SimHash与数据表中图像A的SimHash的汉明距离大于等于设定的值,则图像A不是该 图像的复制图像,所述的图像A为图像数据表中的任意一个图像。步骤(5)更新图像数据表,将输入图像的SimHash添加到图像数据表,等待下一个 输入图像,重复步骤(1)。本专利技术相对于现有技术具有以下有益效果本专利技术在大规模图像库中具有实时的 处理速度;同时该方法能够适应图像变换(颜色量化、尺度变换、logo添加等)带来的影 响。附图说明图1表示本专利技术的流程图;图2表示本专利技术中SimHash的分组结构图;图3表示本专利技术中存储所有图像的SimHash的表结构图;图4表示SimHash列表根据G1的有序分组的表结构图;图5表示快速取得汉明距离的索引表。具体实施例方式下面将结合附图对本专利技术加以详细说明,应指出的是,所描述的实施例仅便于对 本专利技术的理解,而对其不起任何限定作用。本专利技术方法的具体步骤为步骤(1)将输入图像进行预处理操作;所述的预处理操作是进行输入图像归一化 操作,即将输入图像缩小或放大到设定的尺寸。步骤(2)对预处理后的图像计算图像中每个像素的哈希值。所述的像素的哈希值 是根据图像中像素的颜色值和相邻像素的颜色值来确定的。步骤(3)根据获得的像素哈希值计算图像的相似哈希值(SimHash)。所述的 SimHash计算为成熟的算法,该算法中的每个像素的哈希值权重weight由像素在图像中的 位置权重P和该像素与相邻像素的最大颜色差权重c决定。即weight = p+c ;如果像素位置(x,y)符合下述条件Width/4 < x < width X 3/4 且 Height/4 < y < height X 3/4 则 p = 2 ;否则 p = 1 ;其中width和height为图像的宽和高。如果该像素与相邻像素的最大颜色差大于阈值,则c = 2,否则c = 1。步骤(4)根据获得的图像SimHash检索图像数据表,如果该图像SimHash与数据表中图像A的SimHash的汉明距离小于设定的值,则图像A为该图像的复制图像;如果该图 像SimHash与数据表中图像A的SimHash的汉明距离大于等于设定的值,则图像A不是该 图像的复制图像,所述的图像A为图像数据表中的任意一个图像;步骤(5)更新图像数据表,将输入图像的SimHash添加到图像数据表,等待下一个 输入图像,重复步骤(1)。在本专利技术中,其输入的图像可以是各种图像获取设备获取的图像,例如数码相机 拍摄得到的图像、带拍摄功能的移动电话、带摄像功能的PDA或者可以是视频图像中的一 帧等。如果输入图像是模拟信号,需要一个数模转换工具,把模拟图像转换为数字图像进行 处理。本专利技术方法处理的图像可以针对各种图像编码格式,例如JPEG、BMP等,只要能将该 格式的图像转换为位像即可。在此实施例中假定输入的图像已经是位像。在以下 的叙述中,图像就是指数字图像,不再具体指明。本实施例中主要介绍在大规模图像库中检 测复制图像方法。其可用于图像数据的整理、图像检索系统的去重和图像内容拷贝检测系 统,但是本专利技术方法同样可以适用其它需要检测复制图像的应用场合。下面将参考附图进一步介绍本专利技术的实施例。图1是一个流程框图,表示了本专利技术的流程图。图1中图像预处理单元,主要包括 图像的尺度变换。尺度变换将输入图像归一化到设定的尺度,在此实施例中,归一化的图 像大小为800X800。图像尺度变换方法采用四近邻双线性内插值法。同时,本实施例中, 采用像素的灰度值来计算像素的哈希值,所以本预处理单元中,需要将彩色图像变换为灰 度图像。灰度化方法采用BT709算法,S卩R、G、B三个通道的权重分别为0. 2125,0. 7154, 0.0721。参考图1中计算像素哈希值单元,通过像素和局部相邻像素的颜色值构建像素哈 希值;计算像素的哈希值可以在彩色图像上进行,也可以在灰度图像进行,其关键是利用像 素的哪些特征。像素哈希值是图像中某个像素点局本文档来自技高网
...

【技术保护点】
基于内容的复制图像检测方法,其特征在于该方法包括如下步骤:步骤(1)将输入图像进行预处理操作,所述的预处理操作是进行输入图像归一化操作,即将输入图像缩小或放大到设定的尺寸;步骤(2)对预处理后的图像计算图像中每个像素的哈希值;所述的像素的哈希值是根据图像中像素的颜色值和相邻像素的颜色值来确定;步骤(3)根据获得的像素哈希值计算图像的相似哈希值,所述的相似哈希值计算算法中的每个像素的哈希值权重weight由像素在图像中的位置权重p和该像素与相邻像素的最大颜色差权重c决定,即weight=p+c;如果像素位置(x,y)符合下述条件,则p=2;Width/4<x<width×3/4且Height/4<y<height×3/4如果x或y不在上述范围内,则p=1;如果该像素与相邻像素的最大颜色差大于阈值,则c=2,如果该像素与相邻像素的最大颜色差小于等于阈值,则c=1;其中width为图像的宽,height为图像的高;步骤(4)根据获得的图像相似哈希值检索图像数据表,如果该图像相似哈希值与数据表中图像A的相似哈希值的汉明距离小于设定的值,则图像A为该图像的复制图像;如果该图像相似哈希值与数据表中图像A的相似哈希值的汉明距离大于等于设定的值,则图像A不是该图像的复制图像,所述的图像A为图像数据表中的任意一个图像;步骤(5)更新图像数据表,将输入图像的相似哈希值添加到图像数据表,等待下一个输入图像,重复步骤(1)。...

【技术特征摘要】

【专利技术属性】
技术研发人员:姚金良王小华谌志群王荣波吴海虹王大全陆蓓
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:86[中国|杭州]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利