当前位置: 首页 > 专利查询>英特尔公司专利>正文

使用距离度量的图像检索制造技术

技术编号:2871959 阅读:289 留言:0更新日期:2012-04-11 18:40
马哈朗诺比斯距离测量被用于在数据库的多个图像中识别查询图像。该测量被用于排列一个或多个图像和查询图像的相似性。对于数据库中的所有图像计算方差-协方差矩阵。该方差-协方差矩阵被用于计算该查询图像和数据库中的一个或者多个图像之间的马哈朗诺比斯距离。范围树被用于识别相似的候选图像,以便执行马哈朗诺比斯距离测量。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】
背景本专利技术涉及图像处理,并且更具体地涉及图像的特征描述。图像处理涉及使用计算机进行的图像分析和操作。这门学科包括多种技术,包括模式识别和其它的图像分析、压缩以及编码,列举其中的一些例子如图像传输以及图像构成。图像处理被用在诸如天文学、医药、军事工程、通信、地理、气象学等不同领域。尽管在本质上是直观的,图像可以被加以表征,以使得计算机或者其它基于处理器的系统也可以“看到”图像,或者例如把一个图像和其它图像区别开。图像特性描述的一种方法是标识时刻、熵、质量中心,取向或者其它基于直方图的特征。图像的结构和合成特性也可以作为特征参数。诸如周长、面积、离心率或者欧拉数的几何标记可以数字地标识图像。因为图像经常受到干扰,例如在传输期间,因此图像的特征参数理想地不随着变换而改变。图像变换包括平移、旋转、缩放、剪切、压缩、噪声的融合等。特别是在因特网技术的新兴领域中,图像搜索是一个重要的工具。然而用于图像搜索的不同图像特征可以具有十分不同的结果。这种图像搜索的类型被称为基于内容的图像检索。一种从图像数据库中检索图像的技术是把每个图像和某些特征联系起来。通过使用特征向量,可以把每幅由它的特征值表示的图像映射到n维特征空间中的一点上,在该特征空间中有n个特征被标识。一种相似性查询然后被用来检索处于接近查询图像的相邻位置的那些图像。在执行这些相似性查询时,获得该图像的精确度会由于图像数据库的大小以及计算相似性查询中所涉及的各种特征所需的时间而发生偏移。因而,对于优化图像检索方法存在持续的需要。附图简介附图说明图1是依照本专利技术的实施例的二进制图像的框图2是依照本专利技术的实施例的4相邻像素以及8相邻像素的框图;图3是依照本专利技术的实施例的灰度图像的框图;图4A到4D是依照本专利技术的实施例,表示图3的灰度图像的二进制图像;图5A到5D是依照本专利技术的实施例,表示图3的灰度图像的反射格雷码(reflected gray code)表示;图6是依照本专利技术的实施例的系统的框图;图7是依照本专利技术的实施例,用于对图6系统的多个图像计算方差-协方差矩阵的流程图;以及图8是依照本专利技术的实施例,用于计算图6系统的查询图像和多个图像之间的马哈朗诺比斯距离(Mahalanobis distance)的流程图。详细描述欧拉数为了从图像数据库中检索图像,每个图像必须被加以表征以区别于其它的图像。例如,图像可以被数字地表征。例如,二进制图像数据库中的每个二进制图像可以被赋予一个欧拉数。二进制图像的欧拉数是图像中的连接部分(对象)的数目和图像中的洞的数目之间的差。欧拉数是二进制图像的拓扑特征。欧拉数在二进制图像平移、旋转、缩放以及橡胶板(rubber-sheet)转换中保持不变。二进制图像16可以在一个N×M的像素矩阵20中表示,其中对象像素12被荫蔽(shaded),以表示二进制数值1,而背景像素12未被荫蔽(unshaded),以表示二进制数值0,如图1中所示。在该N×M矩阵20中,连接部分是对象像素集,这样,在该集合中的任何对象像素12都处于同一集合的至少一个对象像素12的8(或4)个相邻位置中。在图2中表示了一个4相邻像素14和一个8相邻像素18。除了二进制图像中的连接部分之外,在一个实施例中,洞被定义为背景像素集,这样,在该集合中的任何背景像素都处于同一集合的至少一个背景像素的4(或8)个相邻位置中,并且整个背景像素集合被一个连接部分围绕。像素矩阵20的第i列(或行)的一串被定义为第i列(或行)中连续像素的最大序列。出现在两个相邻列(行)中的两个串,如果一串的至少一个像素在另一串的一个像素的8(或4)个相邻位置中,则认为这两个串是相邻关系。如果被称为I的二进制图像16由单一行(列)i组成,则图像16的欧拉数E(I)和图像16的串数目(记为R(i))相同,如下式所示E(I)=R(i)然而,当二进制图像16由多个行(列)组成时,该二进制图像I可以被进而划分成部分图像Ii,整个图像的欧拉数可以使用以下关系得出E(I)=E(I1∪I2)=E(I1)+E(I2)-E(I1∩I2),以及E(Ii-1∩Ii)=0i其中0i等于两个连续行(列)之间相邻串的数目,例如第(i-1)和第i行(列)。依照一个实施例,二进制图像的欧拉数被定义为对于所有行(列)的串的数目之和与该N×M像素矩阵的所有连续的行(列)对之间的相邻串的数目之和之间的差值。数学表示为E(IN)=Σi=1NR(i)-Σi=2NOi]]>其中IN=I表示整个图像。因而通过知道二进制图像I中串的数目和相邻串的数目,可以计算欧拉数E(I)。欧拉向量用于二进制图像的欧拉数可以被扩展到灰度图像。例如,图3中所示,灰度图像36可在N×M矩阵中表示,其中每个元素22都是在0和255之间表示相应像素强度的十进制整数。每个元素的强度值可被表示为8位二进制向量(b7,b6,b5,b4,b3,b2,b1,b0)。该灰度图像36因而包含8个位元平面(bit plane),或者8个不同二进制图像。如所示,假设的灰度图像36包括3个8位像素22a、22b以及22c,每个都表示一个不同的强度值。在一个实施例中,保留8位二进制向量前面的4个最高有效位元平面(b7,b6,b5以及b4)。实质上,保留了4个二进制图像。在图4A到4D中,表示了这4个二进制图像18a-18d,它们表示图3的灰度图像36的4个最高有效位平面。对于每个二进制图像18a-18d,可以计算欧拉数。在一个实施例中,计算每个二进制图像18的欧拉数之前,4位二进制向量(b7,b6,b5,b4)被转换成它相应的反射格雷码向量(g7,g6,g5,g4),其中g7=b7g6=b7b6g5=b6b5g4=b5b4其中 表示XOR(模2)操作。依照一个实施例,反射格雷码转换的结果分别被表示为图5A-5D的二进制图像28a到28d。众所周知,对于任何二进制向量,相应的反射格雷码都是唯一的,反之亦然。因此,在一个实施例中,原始灰度图像的欧拉向量ξK是一个4元组(E7,E6,E5,E4),其中Ei是部分二进制图像的欧拉数gi,该二进制图像由第i个位元平面组成(4≤i≤7),对应强度值的反射格雷码表示。因而,除了对二进制图像计算欧拉数之外,灰度图像的欧拉向量可以通过以下方式计算,考虑图像的四个最高有效二进制位元平面,将该4位二进制向量转换成它相应的反射格雷码,以及对每个反射格雷码表示计算欧拉数。在使用欧拉向量来表征灰度图像时,某些情形下欧拉向量的元素具有重要性的递减次序。即,元素E7是表征该图像的最重要的,接下来是E6并依此类推。并且,欧拉向量的各种元素的范围和变化大不相同。在这种环境下,采用马哈朗诺比斯距离来提供一种测量,它能够针对图像集的特征捕捉其特性的相似和不相似处。马哈朗诺比斯距离欧拉数Ei因而可以表征二进制图像。通过扩展,包含4个欧拉数E7、E6、E5和E4的欧拉向量ξi可以表征灰度图像。依照一个实施例,每个欧拉数Ei都可被表示为灰度图像的一个“特征”。在一个实施例中,欧拉向量特征构成了图像检索的基础。假设使用欧拉向量ξK表示图像数据库中的每个灰度图像K的特征。需要从图像数据库中检索具有由欧拉向量ξq定义的特征的新的本文档来自技高网...

【技术保护点】
一种方法包括:    量化多个图像的一个或多个特征;    检索包含该一个或多个特征的查询图像;以及    计算查询图像和多个图像中的一个图像之间的马哈朗诺比斯距离。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:T阿查亚B巴塔查亚M昆杜C穆尔蒂A比斯努
申请(专利权)人:英特尔公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1