形状描述符参数的编码方法技术

技术编号:2949087 阅读:275 留言:0更新日期:2012-04-11 18:40
一种通过处理与图像相对应的信号来表示出现在静止或视频图像中的目标的方法,包括:导出多组表示目标形状的坐标值并且量化这些坐标值,以便导出该形状的一个编码表示,并且还包括在第一量化范围上量化第一坐标值以及在一个较小范围上量化较小坐标值。(*该技术在2021年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及例如出现在诸如在多媒体数据库中所存储的图像之类的静止或视频图像中的目标的表示(represention),并且特别地涉及这样一种表示的编码。在诸如图像或视频文库之类的应用中,希望的是对于出现在静止或视频图像中的目标或目标各个部分的轮廓(outline)或形状具有一种有效表示和存储。基于形状的索引和检索(retrieval)的一种已知技术使用曲率缩放空间(CSS)(Curvature Scale Space)表示。CSS表示的细节可以在文件“Robust and Efficient Shape Indexingthrough Curvature Scale Space”(通过曲率缩放空间的强大并有效的形状索引)Proc.British Machine Vision conference,第53-62页,Edinburgh,UK,1996和“Indexing an Image Database by ShapeContent using Curvature Scale Space”(通过形状内容使用曲率缩放空间来索引一个图像数据库)Proc.IEE Colloquium onIntelligent Databases,London 1996中找到,这两篇文章都是F.Mokhtarian、S.Abbasi和J.Kittler的,将其内容引用在此供参考。CSS表示使用目标轮廓的一个曲率函数,从该轮廓上的一个任意点开始。因为轮廓形状被使形状平滑的一系列失真所演变,故研究曲率函数。更明确地,计算以高斯滤波器系列旋转的曲率函数的导数的零交叉。将零交叉被绘制在一个曲线图上,通称为曲率缩放空间,在此X轴是该曲线的标准化弧长,而Y轴是演变参数,更明确地,是所应用的滤波器的参数。曲线图上的曲线形成轮廓的环路特性(loopscharacteristic)。目标轮廓的每一凸形或凹形部分对应于该CSS图像中的一个环路。CSS图像中的最突出环路的峰值坐标被用作该轮廓的一个表示。为了搜索与输入目标形状匹配的存储在数据库中的图像中的目标,计算出一个输入形状的CSS表示。通过使用匹配算法来比较在各个CSS图像中的峰值的位置和高度,确定输入形状和存储形状之间的相似性。在一个描述符中表示轮廓形状的特性所需要的比特数目应该尽可能小,以便于进行有效存储和传输。在随后的权利要求中将阐述本专利技术的各个方面。本专利技术能够提供一个非常小型的表示(根据用于存储的比特数目)而在检索性能中没有任何显著的恶化。下面将参考附图描述本专利技术的实施例,其中附图说明图1是一个视频数据库系统的方框图;图2是一个轮廓的CSS表示;图3是说明CSS表示的坐标值编码的图表。图1示出了根据本专利技术实施例的一个计算机化的视频数据库系统。该系统包括计算机形式的一个控制单元2、监视器形式的一个显示单元4、鼠标形式的一个定点(pointing)设备6、包括存储的静止和视频图像的一个图像数据库8以及一个描述符数据库10,该描述符数据库10存储出现在存储在图像数据库8中的图像中的目标或目标各个部分的描述符。出现在图像数据库中的图像中每一感兴趣目标的形状描述符被控制单元2导出并且被存储在描述符数据库10中。控制单元2导出在执行如下所述方法的一个适当程序的控制下操作的描述符。首先,对于一个给定目标轮廓,该轮廓的一个CSS表示被导出。使用在上面提及的文件之一中描述的已知方法来执行之。更明确地,该轮廓通过一个表示Ψ={(x(u),y(u),u∈}来表示,其中u是一个标准化弧长参数,而(x,y)是目标轮廓上的点的坐标。该轮廓通过用Gaussan核心(kernel)g(u,σ)或类似的核心旋转Ψ而被平滑,并且演变曲线的曲率零交叉被检查作为σ变化。使用曲率的下列表达式来识别零交叉。k(u,σ)=Xu(u,σ)Yuu(u,σ)-Xuu(u,σ)Yu(u,σ)(Xu(u,σ)2+Yu(u,σ)2)3/2]]>在此X(u,σ)=x(u)*g(u,σ)Y(u,σ)=y(u)*g(u,σ)和Xu(u,σ)=x(u)*gu(u,σ)Xuu(u,σ)=x(u)*guu(u,σ)在上面,*表示卷积而下标表示导数。曲率零交叉的数目改变为σ变量,并且当σ十分高时,Ψ成为没有零交叉的一个凸形曲线。零交叉(u,σ)被绘制在一曲线图上,通称CSS图像空间。这导致原始轮廓的多个曲线特性。特性曲线的峰值被识别并且相应的坐标被提取和存储。在一般的术语中,这给出了一组n个坐标对,其中n是峰值的数目,而xi是第i个峰值的弧长位置,并且yi是峰值高度。特性曲线的顺序和位置以及它们出现在CSS图像空间中的相应峰值取决于如上所述的曲率函数的起始点。峰值坐标被重新排列,如下所述。让我们假定从中提取参数的轮廓有n个峰值,峰值参数形成一组{(x1,y1),(x2,y2),…(xn,yn)},如图2所示。然后根据高度按照递增或递减的顺序排列这些峰值{(x1,y1),(x2,y2),(xn,yn)}(下标表示在排序之后的峰值序号)。让我们假定按照递减的顺序排列峰值,所以最高峰值是第一个(x1y1),并且每一后续峰值低于或等于该组中的其前者(图3)。这些重新排列的峰值坐标形成目标轮廓的描述符的基础。诸如环状(circularity)C、偏心率(eccentricity)E和紧密度(compactness)D之类的另外的形状参数(其中某些从所谓的“原型轮廓形状(prototype contour shape)”中被提取)还可以被计算并存储,以便用于如在共同悬而未决的申请no.GB 9916684.5中所述的匹配处理中,该申请的内容在此被结合以便参考。接下来,执行峰值高度的粗略量化。对于每个峰值,执行量化的范围是不同的,并且取决于较高峰值的值(例如,在作为被排列组中的在前者的那些峰值的高度)。参见图3,第一峰值在范围I1=上被量化,在此,Ymax是对某一类形状所期待的峰值的最大值。每一剩余峰值被量化到该范围,这取决于一个或好几个在前峰值的值。例如,峰值y2在间隔I2=上被量化,(图3)峰值y3在间隔上被量化,等等。在这个实施例中,使用7比特把第一峰值量化在间隔上并且在适当的各个范围上把剩余峰值量化到比特3,如上所述。假如第一峰值的高度是893,那么使用3比特在范围上把y2量化,等等。因此,对于峰值y2到y5,量化间隔被降低,尽管使用较少的比特,但给出更大的精确度。每个峰值的X坐标被量化到在间隔上均匀分布的6比特。x值可以是原始X值,例如如图2所示,或者在沿着x轴偏移一个数量之后,以使最高峰值的x值在0处。让我们检查从本专利技术中的获益。在传统解决方案中,每一峰值需要两个浮点数,每一个是4字节。因此,对于具有9个峰值的一个典型形状,存储要求是9*2*4=72字节(576比特)。在应用所建议的实施例之后,第一峰值需要7个比特,假定x值被作为零来对待,并且每个连续峰值为6+3比特,因此总共为79比特。代替一个范围,一个范围(0,R(yi))可以被使用,在此,R(yi)是在逆量化之后的值yi的重建。具有本文档来自技高网...

【技术保护点】
通过处理与图像相对应的信号来搜索图像中的目标的一种方法,所述方法包括:输入一个查询目标,导出所述查询目标的表示,将所述查询表示与图像中的多个目标表示进行比较,和选择和显示图像中其表示指示与所述查询的相似程度的 那些目标,其特征在于:图像中的目标表示是目标形状的曲率缩放空间(CSS)表示的峰值的量化坐标值,其中CSS表示的峰值以峰值高度分量值的降序进行排列,并且用于峰值高度分量值的量化范围基于在前的峰值高度值的值。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:M波贝尔
申请(专利权)人:三菱电机株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1