用于大图像集的有效的图像匹配制造技术

技术编号:13233324 阅读:82 留言:0更新日期:2016-05-14 20:43
删除在图像之间的相似部分的系统和方法在此被公开。该系统和方法允许在查询图像和一个或多个目录图像之间的比较,以一种对查询图像的扫描、缩放、旋转、剪裁和其它失真弹性的方式。该系统包括图像处理模块,其识别目录图像的主特征并使用一个或多个主特征构造特征向量。对于每一个主特征,由环境特征的测量所组成的向量被添加作为主特征的小块信息。得到的向量是多维的。例如,该系统可以构造k维向量,其描述在邻近于在目录图像中识别的每个主特征的区域内的点的强度。

【技术实现步骤摘要】
【国外来华专利技术】【专利说明】用于大图像集的有效的图像匹配
技术介绍
图像权利持有人可在专业图像库中发布图像,在那里它们可以被查看并被其他人 许可。专业图像库通常利用技术来标记数字图像,使得它们的合理使用可以被监控和收取 费用,并且识别它们的未经授权的使用。例如,图像库可以通过将特殊的代码直接嵌入到图 像中在图像上印水印。通过用水印来搜索图像,专业图像库可以识别图像的使用并评估这 种使用是经权利持有者授权或未授权的。 尽管当图像被直接复制和使用时,图像保护方案通常是非常有效的,但如果对图 像进行修改,则许多保护方案会被击败。例如,检测已被剪裁、调整大小或部分修改的图像 可以是困难的。此外,对于普通的保护方案而言,识别作为打印原件的扫描件的未授权的数 字图像可以是非常困难的。例如,由报纸或杂志提供的图像可被扫描,然后以一种使其非常 难以被检测的方式在互联网上被发布。 -些现有的图像比较系统可以将图像与相同图像的不同版本匹配。然而,这些系 统在识别重数字化的图像版本中通常具有有限的有效性。这些图像比较系统对于如果图像 已被剪裁、翻转、旋转,色彩平衡已被改变和/或如果其它失真已被应用的图像具有特别不 佳的效果。【附图说明】 图1示出了图像索引、匹配和比较系统的框图。 图2A是用于通过使用主特征表征图像的图像处理模块框图。 图2B是用于将查询图像与图像的目录进行匹配的二步匹配模块的框图。 图3是提取图像的特征点并创建图像的描述符的处理的流程图。 图4是准备数字图像用于通过系统进行分析的过程的流程图。 图5是生成到目录中的图像的索引的处理的流程图。图6A是识别半相同图像的过程的流程图。图7A和7B是根据一个或多个本专利技术公开的实施方式所配置的描绘图像匹配程序 的框图。 图8A描绘了在匹配之前由编辑模块进行分析以移除在图像中的不需要的背景元 素的代表性图像。 图8B是由编辑模块实现的以对编辑图像的近乎相同的搜索结果进行改进的处理 的流程图。 图9A和9B示出了由索引、匹配和比较系统使用的各种数据结构。 图10描绘了由过滤模块进行分析以移除对图像匹配没有益处的图像的某些背景 特征的特点的代表性图像。 图11是由系统使用的以建立反目录的自动化技术的流程图。 具体实施例 检测在图像之间的相似部分的系统和方法在此被公开。该系统和方法允许在查询 图像和一个或多个目录图像之间的比较,以一种对查询图像的扫描、缩放、旋转、剪裁和其 它失真的方式。该系统包括图像处理模块,其识别目录图像的主特征并使用一个或多个主 特征构造特征向量。对于每一个主特征,由环境特征的测量所组成的向量被添加作为主特 征的小块信息。得到的向量是多维的。例如,该系统可以构造k维向量,其描述在邻近于在目 录图像中识别的每个主特征的区域内的点的强度。 该系统还包括匹配模块,其将查询图像与一个或多个目录图像进行匹配。该系统 基于存在于查询图像中的特征和存在于目录图像中的特征的距离测量发现匹配。基于该距 离测量,该系统产生与该查询图像相关联的候选目录图像的列表。 该系统还可以包括过滤模块,其应用一个或多个变换和/或相关(例如,汉明距离 等)在候选图像之间选择,发现一个或多个最佳候选图像,或者如果最近的距离仍然高于预 设的阈值,则没有候选图像。在一些实施方式中,该过滤模块可检测目录图像的一个或多个 剪裁的查询图像。在剪裁的查询图像的情况下,查询图像可以是目录图像的单纯子集或超 集。这样的情况是被允许的,通过使用一组无序描述符来描述每个图像。系统基于给定的特 征执行图像比较,并测试其环境是否是正确的。 原则上所公开的方法可导致对每个查询图像的大量的搜索,并且如将在下面所讨 论的,某些实施方式解决了这个问题。但是,在一些情况下,搜索的数量可以被减少,而不会 对图像比较产生不利影响。例如,即使特征向量可具有126个点,该系统可避免检查所有的 点,而是可以识别和检查最强点的选择。本文公开了多种技术用于识别最强点以进行检查。 在实践中,所公开的系统可以被用于将图像的目录,例如,图像库,与出现在万维 网上的图像进行比较,该图像可能被剪裁、缩放、扫描或以其他方式包括失真。该系统检测 与查询图像的匹配,并提供匹配图像的指示用于额外的检查,由系统操作员或其它应用进 行处理或使用。例如,应用可能使用该系统自动地评估该查询图像是对在图像的目录中的 图像的授权或未授权的使用。 本专利技术的各种实施方式现在将被描述。下面的描述提供了特定细节用于对这些实 施方式的透彻理解和有利描述。然而,本领域技术人员将理解,本专利技术可以在没有许多这些 细节的情况下实施。此外,一些公知的结构或功能可能不被详细示出或描述,以避免不必要 地模糊各种实施方式的相关描述。在下面给出的描述中所使用的术语意图以其最宽的合理 方式来解释,即使它与本专利技术的某些【具体实施方式】的详细描述结合使用。 合适的系统 图1和以下讨论提供了该技术可以被实现的合适的环境的简要、概括的描述。尽管 没有要求,本技术的方面将在计算机可执行指令的一般上下文中被描述,例如由通用计算 机执行的例程。本技术的方面还可以体现在专用计算机或被专门编程、配置或构造的数据 处理器中,以执行本文详细解释的一个或多个的计算机可执行指令。该技术的方面也可以 在分布式计算环境中被实现,其中任务或模块由远程处理设备执行,其通过通信网络被链 接。在分布式计算环境中,程序模块可以位于本地和远程存储器存储设备。 该技术的方面可被存储或分布在计算机可读介质上,包括磁性或光学可读的计算 机磁盘(例如,半导体存储器上的微码、纳米技术存储器、有机或光学存储器,和/或其他便 携式数据存储介质)。的确,根据本专利技术的方面的计算机实现的指令、数据结构、屏幕显示, 以及其它数据可以分布于因特网或其它公共或专用网络上(例如无线网络)。图1示出了图像索引、匹配和比较系统100的示例模块的框图。该系统100包括图像 处理模块102,其从一个或多个图像中提取特征,为每个图像创建一组数字描述符。该图像 处理模块存储在图像目录104中的每个图像的图像和/或数字描述符。查询模块106搜索例 如,可通过因特网访问的网站上的图像。由该查询模块106定位的查询图像可以由图像处理 模块102分析,以对每个查询图像创建一组数字描述符。匹配模块108在图像目录104中搜索 具有预定数目的描述符的目录图像,该描述符至少类似于每个查询图像的描述符。如将在 本文中进一步详细描述的,匹配模块应用两级分析法查找并缩小可能与特定的查询图像匹 配的候选目录图像的范围。在一些实施方式中,编辑模块114可被配置为滤除通用的背景、 背景对象(例如,徽标),和/或其它在图像中不是很感兴趣的对象。例如,编辑模块可以滤除 公知的对象、地标、海报、标志,标记等。该系统100可以通过使用一个或多个处理器120与存储区域122通信以执行模块 和/或在模块之间的信息或数据的流动或处理。存储区域可包括易失性或非易失性存储器, 如ROM或RAM,以及磁性或光学存储设备,如硬盘驱动器或闪存短缺驱动器。该存储区域包含 实施模块的必要的指令或数据,并且处理器120可经由总线116访问。即,存储器122包含数 据结构或其它文件或应用以建立图像的目录并将一个或多个查询图像与在目本文档来自技高网...

【技术保护点】
一种用于将查询图像与图像的目录匹配以识别半相同图像的计算系统中的方法,所述方法包括:维持到图像的目录的反向索引,在图像的所述目录中的每个图像都由与所述图像的主特征点相关联的向量表征,所述反向索引是由与每个图像相关联的所述向量的哈希值所组成的;接收查询图像,所述查询图像是将相对于图像的所述目录被搜索的;通过:从所述查询图像中提取主特征点;创建表征所提取的主特征点的向量;以及为表征所述查询图像的所述向量的每一个生成哈希值;来表征所接收的查询图像;以及通过:将所述查询图像哈希值与所述图像的目录的所述反向索引进行比较;识别与所述查询图像哈希值具有共同的预定数量的哈希值的目录图像集合;识别在所识别的目录图像集合中的每个图像中的若干几何内点;以及基于具有总数超过阈值的几何内点的图像,从所述目录图像集合中识别近乎相同的图像集合;来搜索所述图像的目录,以找到所述查询图像的半相同图像。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:尤里·拉维艾利·戈兹格雷戈里·贝热尔曼
申请(专利权)人:匹斯奥特以色列有限公司
类型:发明
国别省市:以色列;IL

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1