利用快速搜索块匹配的运动估计制造技术

技术编号:2929996 阅读:168 留言:0更新日期:2012-04-11 18:40
提供了一种视频编码器和相应的方法,以编码用于图像块的视频信号数据和特定参考图片索引以预测该图像块,其中该编码器(100)包括一个快速搜索块运动估计器(180),用于提供相应于所述至少一个特定参考图片的运动矢量,该运动估计器包括一个快速搜索块匹配部分,用于执行快速搜索块匹配,同时根据该图像块象素的归一化相对于该参考图片象素的归一化的比较来排除非最佳搜索点,所述快速搜索块匹配部分具有响应于所述至少一个特定参考图片的输出;以及该相应的方法(200)包括:接收基本上未压缩的图像块(212),与至少一个特定参考图片相对应地块匹配(214)该图像块,同时根据该图像块象素的归一化相对于该参考图片象素的归一化的比较来排除非最佳搜索点,计算(216)相应于该图像块与该至少一个特定参考图片之间差异的运动矢量,并且与所述运动矢量相对应地对该至少一个特定参考图片进行运动补偿(218)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总地涉及视频编码器和译码器,并且具体地,是关于视频编码器和译码器中的运动估计算法。
技术介绍
视频数据通常以比特流的形式被处理和传送。典型的视频压缩编码器和译码器(“编译码器”)通过形成对要编码图片的参考图片预测、并且编码当前图片和该预测间的差异,而获得它们的较大的压缩效率。预测与当前图片越相关,则压缩那个图片所需要的比特越少,由此提高了处理的效率。因此,期望形成最佳可能的参考图片预测。在包括运动图像专家组(“MPEG”,)-1、MPEG-2和MPEG-4的许多视频压缩标准中,对先前参考图片和当前图片间的运动进行估计以形成先前参考图片的运动补偿版本。先前参考图片的运动补偿版本被用作对当前图片的预测,并且只编码当前图片和该预测间的差异。运动估计在当前的视频编码系统中发挥重要的作用,并且通常是编码器的在计算上最复杂的部分。当前的大多数视频编码标准采用了块匹配算法。逐块地估计运动量的全搜索策略是流行的运动估计方法。不幸的是,全搜索策略的复杂度非常高,尤其是对于采用多参考图片和多块类型的高级视频编码标准,诸如H.264。已经提出了几种快速搜索算法,诸如三步搜索、新三步搜索、钻石搜索、带状搜索、分级搜索、或者多分辨率(multi-resolution)搜索或者它们的组合。这些算法通过减少搜索点的数目来降低复杂度。不幸的是,它们在误差面(error surface)上趋于陷入局部最小。因此,它们的性能通常比全搜索策略要差。大多数当前的视频编码标准采用块运动估计来减小比特率。用于视频编码的块运动估计已经被很好地研究,但对于多参考图片和多块类型选择只有很少几种算法已经被提出,诸如在H.263++以及JVT/H.264/MPEG AVC中的算法。在H.264中,提供了各种模式用于运动补偿。每种运动补偿的宏块模式对应于一个固定尺寸的块。块可以被分割成16×16、16×8、8×16、以及8×8。8×8块可以进一步被再分割成8×4、4×8或4×4的块尺寸。因此,总计支持7种块类型。每个预测编码的m ×n块的预测信号是通过位移相应的参考图片区域来得到的,其中所述参考图片区域由来自运动矢量预测器的、差分编码的平移运动矢量来指定。H.264也支持多图片运动补偿的预测。也就是,一个以上的先前编码的图片可被用作为参考以便构建预测编码块的预测信号。因此,对于运动估计,编码器必须决定应当选择哪种块类型以及哪个参考图片。这种多参考图片和多块类型选择使得运动搜索更加复杂。当前,已经提出了全搜索(“FS”)和几种快速搜索算法用于运动搜索,诸如象三步搜索、新三步搜索、钻石搜索、带状搜索以及分级搜索。其中,通常只有全搜索得到了最佳解决方案。因此,需要的是一种用于减小全搜索算法的复杂度同时得到最佳解决方案的方法。专利技术概述通过在视频编码器和译码器中利用快速搜索块匹配的运动估计的装置和方法,致力于解决现有技术的这些和其它不足和缺点。视频编码器被提供以编码用于图像块的视频信号数据和特定参考图片索引以预测该图像块,其中该编码器包括快速搜索块运动估计器用于提供相应于所述至少一个特定参考图片的运动矢量,该运动估计器包括一个快速搜索块匹配部分,用于执行快速搜索块匹配,同时根据该图像块象素的归一化相对于该参考图片象素的归一化的比较来排除非最佳搜索点,所述快速搜索块匹配部分具有响应于所述至少一个特定参考图片的输出。用于编码图像块的视频信号数据的相应的方法包括接收基本上未压缩的图像块,与至少一个特定参考图片相对应地块匹配该图像块,同时根据该图像块象素的归一化相对于该参考图片象素的归一化的比较来排除非最佳搜索点,计算相应于该图像块和该至少一个特定参考图片之间差异的运动矢量,并且与所述运动矢量相对应地对该至少一个特定参考图片进行运动补偿。本专利技术的这些和其它特征、特性和优点将从以下示范实施例的描述中变得清晰,示范实施例要结合附图来理解。附图简述因此通过参考本专利技术的实施例可以得到实现并且能够详细理解本专利技术的上述特性的方式、对以上简要概述的本专利技术的更具体的描述,其中所述实施例在所附图中图示。然而应当指出,附图仅仅图示了本专利技术的典型实施例并且因此不应被看作限制它的范围,因为本专利技术可以承认其它同样有效的实施例。附图说明图1示出了根据本专利技术原理的具有快速搜索块匹配运动估计的视频编码器的框图;图2示出了根据本专利技术原理的用于编码处理的流程图;图3示出了根据本专利技术原理的用于译码处理的流程图;以及图4示出了根据本专利技术原理的用于和快速搜索块匹配运动估计一起使用的视频译码器的框图。优选实施例详述本专利技术通过使用快速搜索块匹配来执行运动估计。本专利技术的实施例利用逐次消元法来丢弃非最佳搜索点,并且利用预先计算的数据来节省计算量而不牺牲全搜索方法的最优性。运动估计技术已经得到广泛研究。对于被编码图片的每个运动块,挑选一个代表该运动块距参考图片的位移的运动矢量。在搜索区域内以穷举搜索方法,测试在关于该运动块位置的偏移的预定范围内的每一位移。所述测试包括计算当前图片中运动块内的每个象素与参考图片中位移的运动块之间的绝对差(“SAD”)或均方误差(“MSE”)的和。选择具有最低SAD或MSE的偏移作为运动矢量。已经提出了这种技术上的多种变化,诸如象三步搜索和速率失真优化运动估计。以下的描述仅仅说明本专利技术的原理。因此应当理解,本领域的技术人员将能够设计出各种安排,它们尽管没有在这里明确地描述或示出,但却体现本专利技术的原理并且被包括在本专利技术原理的精神和范围之内。此外,这里陈述的所有例子和条件语言主要打算明确地仅仅用于示教目的,以帮助读者理解本专利技术的原理和专利技术人为促进该技术所贡献的概念,并且它们被解释为并不限于这样具体陈述的例子和条件。此外,在这里陈述本专利技术的原理、特征和实施例及其特定例子的所有表述打算包括其结构和功能上的等价物在内。另外,还打算使这样的等价物包括当前已知的等价物以及将来研发的等价物,即,被研发来执行同样的功能而不考虑结构的任何元件。因此,例如,本领域的技术人员应当理解这里的框图代表体现本专利技术原理的说明性电路的概念上的视图。同样,应当理解任何流程图、程序框图、状态转移图、伪代码等等代表各种处理,这些处理可以基本地在计算机可读媒体中表示并且由计算机或处理器来执行,无论这样的计算机或处理器有没有被明确地示出。图中示出的各种元件的功能可以通过使用专用硬件以及能够与适当软件相联合地执行软件的硬件来提供。当由处理器提供时,所述功能可以由单个专用处理器、单个共享处理器、或者多个个体处理器来提供,其中所述个体处理器中的某些可被共享。此外,术语“处理器”或“控制器”的显式使用不应当被解释为专门地指能够执行软件的硬件,还可能隐含地包括,但不限于数字信号处理器(“DSP”)硬件、用于存储软件的只读存储器(“ROM”)、随机存取存储器(“RAM”)以及非易失性贮存器。也可能包括常规的和/或定制的其它硬件。同样地,图中示出的任何开关只是概念性的。它们的功能可以通过程序逻辑的操作、通过专用逻辑、通过程序控制和专用逻辑的交互作用、或者甚至手工地来实现,随着对上下文的更具体理解,特定的技术可由实施者来选择。在本权利要求中,被表达为用于执行特定功能的装置的任何元件打算包括执行该功能的任何方式,包括例如a)执行该本文档来自技高网...

【技术保护点】
一种编码用于图像块的视频信号数据的方法(200),该方法包括:接收(212)基本上未压缩的图像块;与至少一个特定参考图片相对应地块匹配(214)该图像块,同时根据所述图像块象素的归一化相对于所述参考图片象素的归一化的比较来排 除非最佳搜索点;计算(216)相应于所述图像块和所述至少一个特定参考图片之间差异的运动矢量;以及与所述运动矢量相对应地对该至少一个特定参考图片进行运动补偿(218)。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:P殷JM博伊斯
申请(专利权)人:汤姆森许可公司
类型:发明
国别省市:FR[法国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利