基于多帧的数据流分割的方法和装置制造方法及图纸

技术编号:2951362 阅读:227 留言:0更新日期:2012-04-11 18:40
一种对图象序列进行分割的方法,所述序列由帧构成,每一帧由输入信号的取样组成,其特征在于,所述方法包含下述步骤: (1)形成一参考图象,所述参考图象由从多个所述帧得到的取样组成, (2)对从所述参考图象到每一所述参考帧的运动进行估计, (3)将所述经估计的运动重新格式化成行矢量, (4)将所述行矢量集合到一运动矩阵内, (5)对所述运动矩阵进行主分量分析(Principal Component Analysis),从而得到一个由多个称作为行矢量的载荷矢量组成的标记矩阵,和由多个称作为行矢量的载荷矢量组成的载荷矩阵,从而每一标记矩阵对应于用于每一帧的一个元素,从而每一载荷矢量的每一元素对应于参考图象的一个元素,从而所述标记矩阵的一列和一个载荷矢量一起构成一个因子,并且从而所述因子数小于或等于所述帧的数量, (6)将每一载荷重新格式化回到用作运动的同样的格式, (7)根据所述重新格式化的载荷中的第一个进行分割。(*该技术在2016年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及通过参数系或参数的子空间的推导和分析在大信号流中实现分组或分割的方法。尤其涉及视频信号的时空分割的方法。背景大信号流(如视频信号或声音信号)的数学参数化法存在统计估计问题和计算容量问题。信号流的分割可以减少这两个问题。首先,通过将信号流分成两个或更多个特殊相互关联的子组信号或分割信号,可以使产生的数据的数学表述需要更少的独立参数。这就简化了统计模型。其次,因为更紧凑,每一分割模型还可以更易于控制和解释,例如用于编辑时。第三,在对信号流进行分割以后,各分割的计算处理可以比对整个数据流的处理在计算上更简单,例如,减少了有效计算所需的高速存储器。为了从对数据流的分割获得统计、计算上的这些优点,分割过程本身必须是在统计和计算上是有效的。本专利技术涉及如何获取有关的可靠分割。然而,本专利技术还可以应用于其他类型的信号如声音信号,多帧数字视频信号是一种主要的应用,因而将作为例子来描述。视频编码中分割的使用在基于模型的视频编码中,图象分割很重要应当将显示随各组帧而变化的一致相关空间图形的象素组一起建模(model),因为这样提供了最好的压缩、可编辑性和可解释性。一个分割可以对应于一个物理对象,但也可以仅对应于一部分物理对象,或对应于一组几个这样的物理对象。也可以对应于非有形对象或现象,如阴影。在基于面向统计模型的视频编码中,分割(‘holon’)的最佳定义不同于编码的目的对于纯粹的压缩目的,分割理想地对应于经最有效压缩的象素组,但如果目的是为了对以后的视频操作进行编码,如编辑或视频游戏,那么分割就理想地更加与物理对象有关。分割过程必须是很稳健(robust)的,即,必须明显地提供可接受的、统计有用的分割,可应用于许多相关的图象帧。并且,它在计算上必须适合于cpu时间和存储器要求。某些现有的分割方法可参见Boyer,K.L.,Mirza,M.J.和Ganguly,G.(1994),The Robust Sequential EstimatorA General Approach and its Application to Surface Organization in Range Data.IEEETransactions on Pattern Analysis and Machine Intelligence 16,1994年10月10日,第987-1001页;Guensel,B.和Panayirci,E.(1994),Segmentation of Range and Intensity ImageUsing Multiscale Markov Random Field Representation.Proceedings,IEEE Intl.Conf.on Image Proc.,Austin Texas,1994年11月13-16日,第II卷,第187-191页,IEEEComputer Soc.Press Los Alamitos,CA,USA;Dellepiane,S.,Fontanta,F.和Vernazza,G.(1994),A Robust Non-IterativeMethod for Image Labelling Using Context.Proceedings,IEEE Intl.Conf.on ImageProc.,Austin Texas,1994年11月13-16日,第II卷,IEEE第207-211页,ComputerSoc.Press Los Alamitos,CA,USA;以及Russ,J.C.(1995)The Image Processing Handbook,第2版,IEEEPress/CRCRPress,伦敦,第347-401页,上述论文在此引述供参考。视频编码的分割方法主要有两种主要的类型静态图象分割和基于运动的分割。静态图象分割是基于在单独的图象中限定空间强度模式。这种类型的分割的缺点是较难区分物体边缘的内部和沿物体边缘的空间的轮廓。基于运动的分割涉及图象强度是如何在图象之间变化的。在自动视频编码中,分割通常是基于后者,并且是通过运动场的估计分析而获得的。一种已建立的分割方法是估计两个帧之间的运动场(比方说从参考帧R和另一帧n(这里称为‘地址差别’DARn)),并且搜寻具有相似运动的DARn中的象素组。另外,重要的是象素在物理上是至少在其中一个图象内相互靠近。DARn可以有一个、两个或更多个运动维度。可以使基于运动的分割一般化成基于变化的分割,这里,变化还可以包括‘强度差别’,即,各对帧对之间的强度变化D1Rn,例如,经运动补偿和在不同的色彩信道上。在将分割用于许多帧的情况下,由于统计过拟合(overfitting)的现象,并且因为选择的帧可以是没有充分代表了问题中其余帧时,将分割基于仅仅一个帧或一对帧是不能令人满意的。然而对分割中实际使用的帧或帧对会是很好的分割时,所获得的分割对其他帧可以表示为很坏的分组。为了在统计上找到对许多帧均有效的分割,必须搜寻许许多多这样的帧,比方说,5-50个,找到在统计上相关的象素聚类。这样是有缺点的。为了对这些帧单独地进行分割,需要随后协调不同的帧分割结果。每一帧分割对该帧输入数据中的噪声是敏感的。同时,为了存储用于许多独立帧的运动场,可以需要许多存储器,并且为了同时执行对所有这些运动场的分割分析,在计算上是昂贵的。专利技术目的本专利技术的目的是便于找到信号流中信号的分组,从而分组或分割对数个信号帧具有高统计稳健性和高有效性。本专利技术的进一步目的是在使分割中所需数据量下降的有效计算方式下执行多帧分割。本专利技术的进一步目的是确保分割可以按照前向或后向更新递归进行。本专利技术的再一个目的是能够在分割中采用不同类型的现象-时间运动和强度变化信息以及空间的连续性和间断信息。本专利技术的进一步的目的是估计分割信息,以便对后续运动信息和强度变化进行估计以及对这些信息进行双线性(bilinear)建模(modelling)。本专利技术的又一个目的是使分割能够部分重叠。本专利技术的再一个目的是使分割能够部分透明(transparent)。本专利技术的又一个目的是定义分割,从而一方面(对于统计稳定性)在内部系统相似性和严格性而另一方面(对于输入数据的理想描述)在内部不均匀性和灵活性之间具有恰当的平衡。专利技术概述本专利技术中,分割是根据数个相关帧的变化信息进行的,变化不仅仅在两个帧之间。因而获得的分割在统计上更可靠并具有更高的有效性。在分割计算中表示许多变化的方式最好是通过公共的参数系或子空间模型,主要是采用根据公共参考位置的双线性模型(modelling)。由于可以忽略某些基于噪声的和其他的不重要的变化类型,这进一步提高了分割的统计准确性和有效性。通过减少分割中需要分析的变化数据的维度,这还减少了分割工作的计算复杂性。在子空间表述本身是递归更新的情况下,子空间分割可以递归更新,这提供了计算上的优点。分割中使用的变化信息可以多种多样,可以是运动信息,也可以是密度变化信息。本专利技术一般可以应用于信号流。尤其可以应用于数字信号的时空分割和数字声音数据的时间分割。附图简述附图说明图1描述的是如何沿运动方向(这里,DVRn是将每一象素沿纵向移动)从图象R移动(卷绕)到接近本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:哈拉尔德·奥高·马滕斯让·奥托·雷伯格
申请(专利权)人:德国IDT国际数字技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1