运动估计方法和装置制造方法及图纸

技术编号:8765879 阅读:117 留言:0更新日期:2013-06-07 23:42
公开了一种运动估计方法和装置。该运动估计方法包括:通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面;通过在参考画面中进行全搜索,找出当前画面中的每个基本像素单元的最佳运动矢量,作为当前帧中的每个宏块的多像素精度的最佳运动矢量,其中当前画面中的每个基本像素单元分别与当前帧中的每个宏块相对应,并且参考画面中的每个基本像素单元分别与参考帧中的每个宏块相对应。

【技术实现步骤摘要】

本专利技术涉及图像处理领域,更具体地涉及一种运动估计方法和装置
技术介绍
运动估计(Motion Estimation)是视频处理(例如,视频编码、视频去交织)中广泛使用的一种技术。运动估计的基本思想是将图像序列中的每一帧划分成许多互不重叠的宏块,并认为每个宏块内所有像素的位移量相同,然后在参考帧的某一特定搜索范围内根据一定的匹配准则找出与当前宏块最相似的块(即,当前宏块的匹配块),匹配块与当前宏块的相对位移即为当前宏块的运动矢量。在视频压缩时只需保存当前宏块相对于其匹配块的运动矢量和残差数据,就可以在视频解压缩时完全恢复出当前宏块。通常在视频处理中需要在参考帧的很大搜索范围内进行运动搜索才能找出当前宏块的最佳运动矢量(即,找出与当前宏块最相似的匹配块)。为了得到当前宏块的最佳运动矢量,需要在搜索范围内进行全搜索。全搜索检查所有可能的运动矢量候选,并且提供最精确的结果,但是处理时间非常长。
技术实现思路
鉴于以上问题,本专利技术提供了一种新颖的运动估计方法和装置。根据本专利技术实施例的运动估计方法包括:通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面;通过在参考画面中进行全搜索,找出当前画面中的每个基本像素单元的最佳运动矢量,作为当前帧中的每个宏块的多像素精度的最佳运动矢量,其中当前画面中的每个基本像素单元分别与当前帧中的每个宏块相对应,并且参考画面中的每个基本像素单元分别与参考帧中的每个宏块相对应。根据本专利技术实施例的运动估计装置包括:像素采样单元,用于通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面;第一搜索单元,用于通过在参考画面中进行全搜索,找出当前画面中的每个基本像素单元的最佳运动矢量,作为当前帧中的每个宏块的多像素精度的最佳运动矢量,其中当前画面中的每个基本像素单元分别与当前帧中的每个宏块相对应,并且参考画面中的每个基本像素单元分别与参考帧中的每个宏块相对应。通过本专利技术,可以在非常短的时间内找出当前帧中每个宏块的多像素精度的最佳运动矢量。附图说明从下面结合附图对本专利技术的具体实施方式的描述中可以更好地理解本专利技术,其中:图1示出了对参考巾贞/当前巾贞进行采样的示例;图2示出了在16X16的帧间编码模式下用于搜索当前帧中的任意一个宏块的整像素精度的最佳运动矢量的参考区域;图3示出了根据本专利技术实施例的运动估计装置的框图;以及图4示出了根据本专利技术实施例的运动估计方法的流程图。具体实施例方式下面将详细描述本专利技术各个方面的特征和示例性实施例。下面的描述涵盖了许多具体细节,以便提供对本专利技术的全面理解。但是,对于本领域技术人员来说显而易见的是,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更清楚的理解。本专利技术绝不限于下面所提出的任何具体配置和算法,而是在不脱离本专利技术的精神的前提下覆盖了相关元素、部件和算法的任何修改、替换和改进。为了在有限的时间内在参考帧上执行全搜索从而找出当前宏块的最佳运动矢量,本专利技术提出了一种快速全搜索方法。根据本专利技术的一个实施例,为了执行快速全搜索,首先需要对参考帧和当前帧进行采样。图1示出了对参考帧/当前帧进行采样的示例。其中,图1中所示的像素帧可以被看作参考帧,也可以被看作当前帧。如图1所示,对参考帧/当前帧中的每个4X4块中的像素进行采样,以得到参考画面/当前画面。其中,对参考帧/当前帧中的每个4X4块中的一个特定位置的像素进行采样;并且参考帧/当前帧中的所有4X4块的像素采样位置都是相同的。例如,图1中示出了对参考帧/当前帧中的每个4X4块的第一行、第一列的像素进行采样。但是本领域技术人员应该明白,每个4X4块的像素采样位置不限于图1中所示的位置,而可以是预先设定的任何位置。另外,参考帧中的像素采样位置与当前帧中的像素采样位置相同。经过图1所示的采样得到的参考画面和当前画面的大小均为参考帧和当前帧的1/16(1/4宽度X1/4高度)。所以,在参考画面中进行全搜索从而得到当前画面中的每个4X4块(当前画面中的每个4X4块与当前帧中的每个宏块相对应)的最佳运动矢量仅需要1/16的处理时间(该处理时间是通过对参考帧进行全搜索得出当前帧中的每个宏块的整像素精度的最佳运动矢量所需的时间)。显然,通过基于图1所示的采样过程得出的参考画面和当前画面进行全搜索得出的当前画面中每个4X4块的最佳运动矢量是4像素精度的运动矢量。而在实际的图像处理中,为了确保运动估计的质量,应该执行整像素精度的运动搜索。所以,需要在以根据前述4像素精度的运动矢量找出的参考区域为中心的更大的参考区域内执行全搜索。例如,对于16X16的帧间编码模式来说,对于当前帧中的任意一个宏块B,需要根据当前画面中与宏块B相对应4X4块b的4像素精度的运动矢量在参考帧中找出与宏块B对应的参考区域R,并在以参考区域R为中心的24X 24的区域中进行全搜索,从而得出宏块B的整像素精度的最佳运动矢量。图2示出了在16X16的帧间编码模式下用于搜索当前帧中的任意一个宏块B的整像素精度的最佳运动矢量的参考区域。如图2所示,在根据当前画面中与宏块B对应的4X4块b的4像素精度的运动矢量在参考帧中找出与宏块B对应的16X16的参考区域R之后,分别在上、下、左、右四个方向将16X16的参考区域R扩展4个像素,即可得到与宏块B对应的24X24的用于全搜索的区域。例如,对于16X8的帧间编码模式来说,对于从当前帧中的任意一个宏块B分割出的一个16X8块B’,需要当前画面中与宏块B对应的4X4块b的4像素精度的运动矢量在参考帧中找出与16X8块B’对应的参考区域R,并在以参考区域R为中心的24X16的区域中进行全搜索,从而得出16X8块B’的整像素精度的最佳运动矢量。与图2所示的过程类似,在根据当前画面中与宏块B对应的4X4块b的4像素精度的运动矢量在参考帧中找出与16X8块B’对应的16X8的参考区域R之后,分别在上、下、左、右四个方向将16X8的参考区域R扩展4个像素,即可得到与该16X8块B’对应的24X 16的用于全搜索的区域。对于其他帧间编码模式,依此类推。也就是说,对于某种帧间编码模式,在根据当前画面中与宏块B对应的4X4块b的4像素精度的运动矢量在参考帧中找出根据该帧间编码模式从宏块B分割出的某个大小的子块B’的参考区域R之后,分别在上、下、左、右四个方向将参考区域R扩展4个像素,即可得到与子块B’对应的用于全搜索的区域。在得出各种帧间编码模式下各种子块的整像素精度的最佳运动矢量后,计算在各种帧间编码模式下对于宏块B的编码代价,从而找出编码代价最小的一种帧间编码模式作为宏块B的最佳巾贞间编码模式。图3示出了根据本专利技术实施例的运动估计装置的框图。图4示出了根据本专利技术实施例的运动估计方法的流程图。下面结合图3和图4,详细描述根据本专利技术实施例的运动估计装置和方法。如图4所示,该运动估计装置包括像素采样单元302和第一搜索单元304。其中,像素采样单元302通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面(S402);第一搜本文档来自技高网...

【技术保护点】
一种运动估计方法,包括:通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面;通过在所述参考画面中进行全搜索,找出所述当前画面中的每个基本像素单元的最佳运动矢量,作为所述当前帧中的每个宏块的多像素精度的最佳运动矢量,其中所述当前画面中的每个基本像素单元分别与所述当前帧中的每个宏块相对应,并且所述参考画面中的每个基本像素单元分别与所述参考帧中的每个宏块相对应。

【技术特征摘要】
1.一种运动估计方法,包括: 通过分别对当前帧中的像素和参考帧中的像素进行采样,得到与当前帧对应的当前画面和与参考帧对应的参考画面; 通过在所述参考画面中进行全搜索,找出所述当前画面中的每个基本像素单元的最佳运动矢量,作为所述当前帧中的每个宏块的多像素精度的最佳运动矢量,其中 所述当前画面中的每个基本像素单元分别与所述当前帧中的每个宏块相对应,并且所述参考画面中的每个基本像素单元分别与所述参考帧中的每个宏块相对应。2.根据权利要求1所述的运动估计方法,其特征在于,对所述当前帧中的每个宏块中的固定位置的像素进行采样,并对所述参考帧中的每个宏块中的固定位置的像素进行采样。3.根据权利要求2所述的运动估计方法,其特征在于,对所述当前帧中的每个宏块所包含的每个4X4块中的一个固定位置的像素进行采样,并对所述参考帧中的每个宏块所包含的每个4X4块中的一个固定位置的像素进行采样。4.根据权利要求1至3中任一项所述的运动估计方法,其特征在于,所述当前帧的像素采样位置与所述参考帧的像素采样位置相同。5.根据权利要求1所述的运动估计方法,其特征在于,还包括: 对于所述当前帧中的任意一个宏块,根据所述当前画面中的与所述一个宏块对应的基本像素单元的最佳运动矢量,在所述参考帧中找出与根据特定帧间编码模式从所述一个宏块分割出的每个子块相对应的参考区域;以及 对于根据所述特定编码模式从所述一个宏块分割出的任意一个子块,对与所述一个子块相对应的参考区域进行 扩展,并在扩展后的参考区域中进行全搜索以找出所述一个子块的整像素精度的最佳运动矢量。6.一种运动估计装置,包括: 像素采样单元,...

【专利技术属性】
技术研发人员:付轩郑艳朱建清
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1