确定用于比较运动补偿视频编码中的图像块的度量的方法和系统技术方案

技术编号:6549539 阅读:188 留言:0更新日期:2012-04-11 18:40
描述了这样的方法和系统,其确定衡量用于景象的运动补偿视频编码中的两个图像块之间的区别的度量。仅处理所述景象中的块中的选择的像素以提高所述度量计算的速度。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及运动补偿视频编码领域,具体地,涉及确定用于比较运动补偿视频编 码中的图像块的度量的改进的方法和系统。
技术介绍
对于网络运营商而言,包含各种内容类型(包括文本、音频和视频)的多媒体提供 了巨大的商机和收入机会。高带宽的可用性和分组交换的因特网协议(IP)技术的使用使 得传输丰富的内容(包括如下各种的组合文本、话音、静止图片和动画、照片、视频剪辑以 及音乐)成为可能。为了利用这种市场潜能,网络运营商必须满足客户对于质量和可靠性 的期望。对于在现今的包括移动终端、蜂窝电话、计算机以及其它电子设备的异构网络中呈 现多媒体应用而言,服务器级的媒体的转码是至关重要的。因为各种设备经常是资源受限 的,并且很少能够自己改变媒体,所以必须在服务提供商级执行媒体的适配以及转换。这对 于服务提供商而言是很重要的问题,因为他们将不得不在今后的几年中面对特别急剧的业 务量增长;这种增长远超出可以单独从新的硬件获得的速度提升。使用增加服务器数量的 硬办法(brute-force approach)是不够的。此外,服务器数量的增加将导致功耗、散热和 空间方面成比例的增加。改善系统性能并处理业务量的大量增长的另外的方法是设计用于 视频编码的智能技术,视频编码形成多媒体改变的重要的和资源密集的方面。运动补偿视频编码处理包括块的景象,每个块包括多个像素。本质上所有的现代 视频编解码器使用运动补偿编码,其中相对于多个先前帧来对帧进行编码,从而利用时间 上的依赖性并获得更好的压缩。运动补偿视频编码的最密集的运算方面是运动估计方面。 这通过估计景象的对象从一个帧到下一个帧的位移的运动估计算法来执行。这些估计用于 创建合成帧,其中使得所述景象变形以匹配对象的估计的运动。这种合成帧用作差分编码 的当前帧的预测器。这样的运动估计算法计算量巨大,占编码器的运行时间的绝大部分,分 辨率也随之增加,从而是优化的自然目标。相当大的努力涉及基于块的运动估计问题,该问题是对从参考帧复制的小矩形区 域构造预测帧的一般问题的简化。下面将提供基于块的运动估计的讨论。对于在本文件中 提供的说明,假定基本块是16X16像素。注意到相同的构思可应用于不同大小的块。系统 的目的是产生用于正在被编码的当前帧的预测帧。通过根据给定参考帧来差分编码当前帧 而生成该预测帧。对于当前帧中的每个16X16块,系统查寻参考帧中的最匹配的块。该搜 索检查参考帧中的大量块(不必排列在16X16的边界上)并选择最小化与当前帧的区别 的块。运动矢量(作为运动估计过程中的关键元素)是相对于(在当前帧中的)当前块的 位置仅仅对(参考帧中的)最匹配的块的偏移。于是将最匹配的块复制到补偿帧或预测帧 中的当前块的位置处。在这种处理之后,预测帧是考虑到仅允许复制块时可以从参考帧建 立的最佳近似(根据选择的衡量图像块之间的区别的度量)。补偿帧用作差分编码当前帧 的预测器。现在将在下面简要讨论选择的现有技术文献。研究沿着不同的方向进行。 S. Bormanλ Μ. Robertson、R. L Stevenson 的 “Block Matching Sub-pixel Motion Estimation from Noisy, Undersampled Frames,, (SPIEVisual Communications and Image Processing Conference 1999)介绍了涉及在SAD、MSE和NCF中的噪音和釆样误 差的效果的实验研究。W. Li、E. Salari 的文章 “Successive Elimination Algorithm for Motion Estimation,,(IEEE Transactions on Image Processing,Volume 4,Issue 1, January 1995,第105-107页)探讨了用于设计针对快速运动估计的动态编程等的方法的 SAD和MSE的属性。该作者致力于算法,该算法不需要在解空间中穷举搜索,并讨论将使用 现有的度量的怎样的属性;它们并没有提出任何新的度量。F. Tombari, S. Mattocia, L. di Stefano 的Template Matching Based on Lp Norm Using Sufficient Conditions with Incremental Approximation,, (IEEE International Conference on Video and Signal Based Surveillance,November 2006,第 20 页)扩展了 Li 和 Salari 的工作。该文章使用 类似的动态编程方法来计算快速版本的度量。U. Koc 和 K. J.R.Liu 的 “ Interpolation—free Subpixel Motion Estimation Technique in DCT Domain,, (IEEE Transactions on Circuits and Systems for Video Technology, Volume 8, Issue 4,August l8,第 460_487 页)致力于子像素级,并通过 使用DCT域中的技术试图来避免空间域中的子像素内插,DCT域中的技术至少和在空间 域中使用的技术一样的复杂。适当地扩展度量以处理到DCT域的变换。S. Lee、Soo-Ik Chae 的另一篇文章Two-step Motion Estimation Algorithm using Low Resolution Quantization,, (International Conference on Image Processing,Volume 3,September 1996,第795-798页)致力于运动估计技术。该文章介绍了 SAD匹配的“失败的快速”方法。 首先对图像进行量化,从而减少了每个像素的精度,例如从每个像素8位到每个像素4位。 第一函数使用减少的精度版本比较两个块。如果结果是可接受的,进行到使用全精度度量。 尽管该研究在概念上通过硬件实现来呈现,但是当运行代码的处理器提供这样的装置时它 没有考虑有效利用包括SAD的单指令多数据(SIMD)指令集。本专利技术的重要方面是通过使 用优化SIMD指令集的这种性能来减少在计算度量中所需的时间,该指令集设置在当今的 市场中可用的商用处理器中。在 C. -K. Cheung> L. -Μ. Po 的“A Hierarchical Block Motion Estimation Algorithm using Partial Distortion Measure,, (International Conference on Image Processing, Volume 3,October 1997,第606-609页)中报告的研究通过使用规则网格采 样来使用像素采样,其完全等同于普通的二次采样。他们使用(或者在五点形模式中的,或 者一个在两列中的,一个在两行中的)1/2或1/4像素来计算SAD/MSE。对照1/4本文档来自技高网...

【技术保护点】
1.一种确定用于景象的运动补偿视频编码中的度量的方法,所述景象包括具有像素的块,所述度量衡量第一图像块和第二图像块之间的区别,所述方法包括:(a1)生成用于选择所述第一和第二图像块中的像素的子集的模式矩阵;(b1)获得在步骤(a1)中生成的所述像素的子集中的每个像素的特性;以及(c1)处理所述像素的子集的所述特性以确定所述度量。

【技术特征摘要】
【国外来华专利技术】2008.08.02 US 12/185,0771.一种确定用于景象的运动补偿视频编码中的度量的方法,所述景象包括具有像素的 块,所述度量衡量第一图像块和第二图像块之间的区别,所述方法包括(al)生成用于选择所述第一和第二图像块中的像素的子集的模式矩阵; (bl)获得在步骤(al)中生成的所述像素的子集中的每个像素的特性;以及 (cl)处理所述像素的子集的所述特性以确定所述度量。2.如权利要求1所述的方法,其中所述第一图像块、所述第二图像块和所述模式矩阵 包括相同数量的行和列的像素。3.如权利要求1或2所述的方法,其中所述步骤(al)进一步包括(a2)生成所述景象的全局运动特性,其指示所述景象中的对象的运动方向;以及 (b2)生成与CPU架构对应的所述模式矩阵,其用于所述运动补偿视频编码和所述全局 运动特性。4.如权利要求3所述的方法,其中所述步骤( )进一步包括基于像素预算生成所述模 式矩阵,所述像素预算是所述像素的子集中的像素数量的估计。5.如权利要求3或4所述的方法,其中所述步骤(b2)进一步包括(a3)确定所述景象的平均运动矢量,所述平均运动矢量具有幅度和方向; (b3)将所述平均运动矢量的幅度与无运动的给定阈值比较,包括 (c3)当所述平均运动矢量的幅度小于所述阈值时,将所述全局运动特性确定为表示没 有对象运动的静态;以及(d3)当所述平均运动矢量的幅度等于或大于所述阈值时,基于在步骤(a3)中确定的 所述平均运动矢量的方向将所述全局运动特性确定为水平运动、垂直运动或斜线运动中的 一种。6.如权利要求3至5中任一项所述的方法,其中所述步骤( )进一步包括(a4)从在执行运动补偿之前生成的模式矩阵的库中选择所述模式矩阵,在所述库中的 每个模式矩阵与用于运动补偿视频编码、全局运动特性和像素预算的所述CPU架构对应。7.如权利要求6所述的方法,其中所述步骤(a4)进一步包括 对于在所述的模式矩阵的库中的每个模式矩阵(a6)在所述模式矩阵的单元中存储布尔值,每个单元与在所述第一和第二图像块中占 据相同的位置的像素对应;以及(b6)在所述模式矩阵的所述单元中存储“真”或“假”布尔值中的一个,其与来自所述 第一和第二图像块的、包括在所述度量的计算中的所述像素对应,以及在所述模式矩阵的 所述单元中存储另一个布尔值,其与所述第一和第二图像块中的、排除在所述度量的计算 外的所述像素对应。8.如权利要求1至7中任一项所述的方法,其中所述步骤(bl)包括 (a7)获得所述特性,其是亮度值;(b7)将所述第一图像块中的像素的亮度值存储...

【专利技术属性】
技术研发人员:S·皮金
申请(专利权)人:高等技术学校
类型:发明
国别省市:CA

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1