用于索引和检索多媒体数据的形状匹配方法组成比例

技术编号:2853653 阅读:201 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种用于索引和检索多媒体数据的方法。特别是本发明专利技术提供一种使用形状信息比较至少两个多媒体数据集合以提供集合间相异性检测的方法。本发明专利技术的用处在于根据他们在图像和视频序列数据库中的内容检索图像或部分序列。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种用于索引和检索多媒体数据的方法。更具体的说,本专利技术涉及根据从多媒体数据目标提取的形状特征信息,计算至少两个多媒体信息集合之间的相似性索引。
技术介绍
大型图像和视频序列数据库用于诸如娱乐、商业、艺术、工程和科学的领域中的许多多媒体应用中,根据他们的内容,检索图像或部分序列已成为一项重要操作。形状分析方法在用于目标识别、匹配、注册和分析的系统中扮演着重要的角色。然而,通过形状检索仍被认为是基于内容搜索的最困难方面之一。多媒体数据检索的关键如下将被考虑的多媒体数据特征类型和如何表示这些特征以及如何在特征之间做出比较。形状分析研究中的一个普遍问题是如何判断形状描述/匹配方法的质量。不是所有方法都适合所有种类的形状和每类应用。一般而言,有用的形状分析方案应满足以下条件·对转化的坚固性分析结果对于平移、旋转和缩放以及在定义边界序列中使用的开始点必须是不变的;需要这个条件是因为通过定义,这些转换不改变目标的形状。·特征提取有效性应该有效计算特征矢量(描述符),·特征匹配有效性因为一般在线执行匹配,距离尺度必须需要非常小的计算代价,·对变形的坚固性分析结果对空间噪音必须是坚固的,空间噪音由分段处理引起或因为微小形状改变,·符合人的判断形状相似性/相异性检测必须尽可能符合人的判断。表示形状的已知方法包括MPEG-7采用的描述符;泽尼克(Zernike)动量[A.Khotanzan和Y.H.Hong.泽尼克动量的固定图像识别(Invariant image recognition by zernike moments)IEEE TransPAMI,12489-497,1990]和CSS[Farzin Mokhtarian,Sadegh Abbasi和Josef Kittler通过曲率尺度空间的稳固和有效形状索引(Robust andEfficient Shape Indexing through Curvature Scale Space),英国机器视野会议,1996]。对于泽尼克动量形状描述符,定义关于多种形状的泽尼克基函数,以勘察一幅图像内的目标形状。然后,将固定尺寸的图像投影到基函数之上,并将产生的结果用作形状描述符。对于曲率尺度空间描述符,提取模型图像的轮廓,并以尺度空间表示沿着轮廓曲率点的变化。然后,将峰值的位置用z维向量表示。Zernike动量和CSS描述符具有诸如极快特征匹配和简洁表达的明显优势。不幸的是,大多数简洁形状描述符(也就是Zernike动量)对形状变形不坚固。其他的,如CSS坚固但是匹配这些描述符导致许多错误正数。CSS方法的检索正确性经常很差,特别对于曲线,曲线具有少数的凹状或凸面。特别是,该表示不能区分各种凸曲线。简洁描述符的另一个缺点是他们的提取经常在计算上花费很大。虽然这对产生数据库不是问题(离线执行特征提取),然而这使使用他们用于快速在线比较二进制掩码提供的两个形状变的困难(或甚至是不可能的)。专利技术目的本专利技术的目的是提供计算上有效的形状描述/匹配方法用于快速匹配二进制掩码提供的两个形状。本专利技术的另一个目的在于该方法对形状变形是坚固的,并且不会产生许多错误的正数返回。另一个目的是本专利技术的技术能在在线环境中实施。专利技术概述相应的,本专利技术提供一种改进的技术,用于实施两个形状的相异性检测。根据优选实施例,提供一种使用形状信息比较至少两个多媒体数据集合的方法以用于提供集合间相异性检测,第一集合形成参考集,并相对于第一集合比较第二集合,该方法包括步骤 对每个多媒体数据集合提供一个轮廓点集合,将第一集合的轮廓点和第二集合的轮廓点相关用于定义相关轮廓点,计算所述相关轮廓点之间的距离,而其中使用所述相关轮廓点之间的距离用于确定所述多媒体数据集合之间的相异性检测,因此提供集合间相似性程度的指示符。最好通过搜索每个多媒体数据集合的边界获得每个多媒体数据集合的轮廓点集合。轮廓点集合是向下取样的,用于在每个集合中产生等数目的近似等距轮廓点。在互相相关之前,轮廓点集合最好被平移以及比例尺寸标准化。该方法还包括为每个轮廓点集合建立开始点的其他步骤。通过为每个集合定义所有轮廓点建立开始点,开始点与他们各个轮廓的计算的形心点的距离大于与他们各个形心的最远轮廓点的用户定义第一百分比P1。能让用户输入第一百分比P1。最好以连续形式建立开始点。一般将连续的开始点划分为组,这些组包含小于轮廓点总数的用户定义第二百分比P2。能让用户输入第二百分比P2。每个开始点组一般由离形心最远的开始点表示。在具有最多开始点或最大初始领域的轮廓点集合上,最好将参考开始点认为是最远开始点,并且对于集合上将被比较的每个开始点,旋转要被比较的集合以对齐它的开始点与参考开始点。通过为每个轮廓点集合提供一个控制点,并相应的沿着每个集合的轮廓顺序移动控制点,相关轮廓点最好是互相相关的,并且其中使用控制点关于每个轮廓的移动互相关联每个集合的轮廓点。最好在每个集合对齐的开始点,为每个集合初始化控制点的移动。在控制点围绕轮廓移动的每个步骤,一般计算两个控制点之间的距离,第一集合上控制点和第二集合上下一个轮廓点之间的距离,以及第二集合上控制点和第一集合上下一个轮廓点之间的距离,并且将具有最小的这些计算距离的轮廓点互相关联。一般指定轮廓点,直到控制点已沿所有的轮廓点移动。通过完成每个集合的比例尺寸标准化周长检测,确定最小的所述周长,并进一步确定相关轮廓点之间距离的平均和标准偏差,以确定相异性检测。一般以下等式提供相异性检测D(A,B)=cCIRmin2·|D‾|·|V|]]>其中D(A,B)是集合A和集合B之间的相异性程度c表示用户定义常数,其将相异性程度的值重新调整到适宜范围的值,cirmin是最小周长|D|是相关轮廓点之间的平均距离,以及|V|是相关轮廓点之间距离的标准偏差。在优选实施例中,计算多个相异性检测,每个相异性测量与正在比较的特定排列集合相关,并且其中提供集合间相等级别整体表示的最后相异性检测作为所有计算的相异性检测中最低的。现在将参考以下附图详细描述本专利技术的这些和其他特征。附图说明此后参考相应附图本专利技术的一些实施例,其中附图1表示根据本专利技术的形状分析算法的主要步骤;附图2是根据本专利技术一方面实施的轮廓查找示例;附图3表示在本专利技术的方法步骤中使用的8个领域;附图4描述诸如那些在本专利技术中使用的轮廓查询步骤;附图5表示根据本专利技术如何选择轮廓点;附图6表示根据本专利技术计算轮廓动量使用的区域;附图7给出使用MPEG-7测试图像平移和尺寸标准化的一个示例;附图8给出使用MPEG-7测试图像旋转补偿的一个示例;附图9给出使用MPEG-7测试图像开始点提取的一个示例;附图10给出通过本专利技术的简单指定,指定两个形状的轮廓点的示例; 附图11表示根据本专利技术轮廓点指定的取样步骤。具体实施例方式根据本专利技术,提供一种使用形状信息比较至少两个多媒体数据集合用于提供相异性程度的方法。在本专利技术中,将如何表示特征认为是形状描述而特征比较被认为是形状匹配。相异性程度或检测提供第一集合和参照第一集合测试的第二集合之间相似性的指示符。一般以二进制图像或轮廓的形式提供多媒本文档来自技高网...

【技术保护点】
一种使用形状信息比较至少两个多媒体数据集合以提供集合之间的相异性检测的方法,第一集合形成参考集,并相对于第一集合比较第二集合,该方法包括步骤:a)为每个多媒体数据集合提供轮廓点集合;b)将第一集合的轮廓点和第二集合的轮廓点相关以定义相关轮廓点; c)计算所述相关轮廓点之间的距离,并且其中使用所述相关轮廓点之间的距离以确定所述多媒体数据集之间的相异性检测,从而提供集合间相似性程度的指示符。

【技术特征摘要】
【国外来华专利技术】IE 2003-4-3 S2003/02511.一种使用形状信息比较至少两个多媒体数据集合以提供集合之间的相异性检测的方法,第一集合形成参考集,并相对于第一集合比较第二集合,该方法包括步骤;a)为每个多媒体数据集合提供轮廓点集合;b)将第一集合的轮廓点和第二集合的轮廓点相关以定义相关轮廓点;c)计算所述相关轮廓点之间的距离,并且其中使用所述相关轮廓点之间的距离以确定所述多媒体数据集之间的相异性检测,从而提供集合间相似性程度的指示符。2.如权利要求1所述的方法,其中通过搜索每个多媒体数据集合的边界来获得每个多媒体数据集合的轮廓点集合。3.如权利要求1或2所述的方法,其中向下取样轮廓点集合以在每个集合中产生相同数目的近似等距轮廓点。4.如前述任一权利要求所述的方法,其中在互相相关之前对轮廓集合平移和比例尺寸标准化。5.如前述任一权利要求所述的方法,还包括为每个轮廓点集合建立开始点的步骤,通过为每个集合定义所有轮廓点,建立开始点,每组轮廓点与他们各自轮廓的计算的形心点距离大于用户定义的离他们各自轮廓的最远轮廓点的第一百分比P1。6.如权利要求5所述的方法,其中方法包括能让用户属于第一百分比P1的步骤。7.如权利要求4或5所述的方法,其中以连续的形式建立开始点。8.如权利要求7所述的方法,其中将连续的开始点划分为组,所述组包括小于用户定义的轮廓点总数的第二百分比P2。9.如权利要求8所述的方法,其中该方法包括能让用户输入第二百分比P2的步骤。10.如权利要求8或9所述的方法,其中每个开始点的各组用离所述形心最远的开始点表示。11.如任何权利要求5-10所述的方法,其中参考开始点被认为是具有最多开始点或最大初始区域的轮廓点集合上的最远开始点,并且对于将被比较...

【专利技术属性】
技术研发人员:T阿达梅克N奥康纳S马洛N墨菲A斯米顿
申请(专利权)人:都柏林城市大学
类型:发明
国别省市:IE[爱尔兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1