利用预测指导的抽取搜索的运动估计制造技术

技术编号:2944422 阅读:167 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了一种使用预测指导的抽取搜索运动估计算法的方法和设备。所述预测指导的抽取搜索运动估计算法产生用于对来自视频序列的帧内的宏块进行编码的运动向量。所述算法包括:产生全像素种子向量,在所产生的种子向量周围执行全像素搜索,其后进行分数像素搜索。所产生的全像素种子向量是预测的运动向量和分级的运动向量。分数像素搜索可以在由全像素搜索产生的最终的运动向量周围进行,并且可以包括半像素搜索和四分之一像素搜索。可以用软件和硬件来实现所述预测指导的抽取搜索运动估计算法。所述算法的特点在于改善了效率、可扩展性并且降低了复杂度。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总的来说涉及视频序列中的运动估计,而具体地涉及一种利用 预测指导的抽取搜索运动估计算法的方法和设备。
技术介绍
高质量和低比特速率的视频被广泛地用于电信、娱乐、广播、监视、 数字像机和军事应用。数量越来越多的视频产品依赖于视频压缩来减少用 于存储和/或传输视频序列所需要的比特的数量,举例而言,所述视频产 品如DVD播放器、数字电视机、个人录^4^、多媒体自动唱机、具有视 频能力的蜂窝电话。视频序列由一系列帧构成。为了改善视频lt据压缩效率,可以执行运 动估计。运动估计已经被证明在下述方面是有效的通过^1拟目邻帧之间 的相关性而利用视频序列的时间冗余。在帧的序列中,根据被称为参考帧 的前一帧来预测当前帧。当前帧通常被划分为多个块或者宏块。所述宏块 的大小通常是16x16像素,但是依赖于标准,宏块的大小可以不同。通过 使用某种误差标准,如通过使用绝对差值和(SAD )、最小均方误差(MSE ) 或者平均绝对误差(MAE),当前帧中的每个宏块与在参考帧中的相同大 小的区域(也可以被称为宏块)相比较,以定位最佳匹配的宏块。为了使计算成本最小,运动估计可以在参考帧内的预定搜索区域上进 行。确定用于表示参考帧中的最佳匹配宏块相对于当前帧中的宏块的位移的向量。这个向量被称为运动向量。运动向量通常用于通过对从一帧到下 一帧的图像变化进行编码而不是对整个帧进行编码来压缩视频序列。为了满;uit可视通信应用的高要求,已经开发了许多视频压缩标准。运动估计是许多视频压缩方案的中心部分,例如是ISO/IEC MPEG-1、 MPEG國2、 MPEG-4、 CCITT H.261、 ITU-T H.263、 ITU-T H.264和 Microsoft WMV9/VC-1的中心部分。除了视频压缩之外,运动估计还可 以用于其他应用中,例如可以用于图像稳定、计算机视觉、运动分割和视 频分析。视频编码系统中的典型的运动估计模块通常是计算最密集的部件,并 且就计算时间和功率来说占总消耗的约50-60%,在某些情况下高达80% 。 虽然为了开发有效的运动估计算法已经做了许多工作,但是大多数现有工 作的目标是超大,集成电路(VLSI)系统,而且不是软件友好的。面 向硬件的算法不能提供充分的灵活性,并且需要额外的资源。这些算法的 严格软件实现方式可能得不到相同水准的效率。在许多运动估计算法的开 发过程中,使用计算操作的数量来测量它们的计算复杂度。已经开发的用 于优化计算性能和存储器存取带宽二者的算法非常少,这对于资源有限的 嵌入系统来"i兌^l相当的限制。
技术实现思路
鉴于上述情况,本专利技术提供了一种利用可以用硬件和软件实现的预测 指导的抽取搜索(Prediction Guided Decimated Search, PGDS )运动估计 算法来进行运动估计的方法。所述算法的特点在于改善了效率、可扩展性 并且降低了复杂度,如下所述。而且,用软件实现所述算法使得该算法灵 活,并且可适应于新标准和变化的功能要求。在本专利技术的实施例中,所述PGDS算法包括产生全像素种子向量, 在所产生的种子向量周围执行4^象素搜索,^进行分数像素搜索。为了 启动全像素搜索,期望提供可以引导对最终的运动向量的搜索的一个或多 个开始点。利用所述开始点或者种子可以加速所述搜索。因此,产生两个 全像素搜索种子一预测的运动向量(Predicted Motion Vector, PMV)和 分级的运动向量(Hierarchical Motion Vector, HMV )。所述PVM是根据 相邻的宏块的运动向量而得出的,并且是绝对差和(SAD)加权的中间值 运动向量。所述HMV是利用围绕菱形图案的螺旋搜索根据抽取的当前宏块和以类似方式抽取的参考帧而产生的运动向量。可以采用判决模块来判决是否利用PVM、 HVM或者两者进行4^f象素搜索。因此,所述判决基 于当前上下文和历史数据来进行。还可以通过判决模块来4l/映通过所述全 像素搜索而评估的搜索点的数量,即要检查的候选运动向量的数量。可以 在通过所述4^象素搜索而产生的最终的运动向量周围进行分数像素搜索, 并且所述分数像素搜索可以包括半像素搜索和四分之一像素搜索。在本专利技术的实施例中,在4^象素运动向量周围的半〗象素方形搜索和在半《象素运动向量周围的四分之一像素菱形搜索提供了足够的分辨率。所述分数像素搜 索提供额外的精度,以抑制运动补偿误差。因此,提供了本专利技术的多个方面,连同多个示例性实施例,所述示例 实施例并非意欲为限定性的。一个这样的方面是一种用于视频序列中的运动估计的方法。所述方法包括产生利用预测的种子运动向量编码成本而编码的预测的种子运动向 量;产生利用分级的种子运动向量编码成本而编码的分级的种子运动向 量;基于对所述预测的种子运动向量编码成本和所述分级的种子运动向量 编码成本的比较,为4^象素搜索选择所述预测的种子运动向量、所述分级 的种子运动向量或者两者;对每个所选择的种子运动向量执行所述4^象素 搜索,以基于全像素运动向量的编码成本来选择所述4H象素运动向量;以 及利用所选择的全像素运动向量来执行分数像素搜索,以估计最终的运动 向量。根据另一方面,提供了一种计算机可读存储介质。利用用于在计算机 系统上执行的计算机指令对所述计算机可读存储介质进行编码,所述指令 当被执行时执行一种用于视频序列中的运动估计的方法,所述方法包括 产生利用预测的种子运动向量编码成本而编码的预测的种子运动向量;产 生利用分级的种子运动向量编码成本而编码的分级的种子运动向量;基于 对所述预测的种子运动向量编码成本和所述分级的种子运动向量编码成 本的比较,为全像素搜索选择所述预测的种子运动向量、所述分级的种子 运动向量或者两者;对每个所选择的种子运动向量执行所述4^象素搜索, 以基于全像素运动向量的编码成本来选择所述全像素运动向量;以及利用 所选择的4^象素运动向量来执行分数像素搜索,以估计最终的运动向量。根据另一方面, 一种设备包括处理器和计算机可读存储介质,所述计 算机可读存储介质包含计算机指令,用于在所述处理器上执行以提供一种 用于视频序列中的运动估计的方法,所述方法包括产生利用预测的种子运动向量编码成本而编码的预测的种子运动向量;产生利用分级的种子运 动向量编码成本而编码的分级的种子运动向量;基于对所述预测的种子运 动向量编码成本和所述分级的种子运动向量编码成本的比较,为全像素搜 索选择所述预测的种子运动向量、所述分级的种子运动向量或者两者;对 每个所选择的种子运动向量执行所述全像素搜索,以基于全像素运动向量 的编码成本来选择所述全像素运动向量;以及利用所选择的4^象素运动向 量来执行分数像素搜索,以估计最终的运动向量。在一些实施例中,最终的运动向量可以^1针对所述视频序列中的当前 视频帧内的输入宏块而估计的。最终的运动向量可以在可配置大小的搜索 窗内估计。可以利用用于相邻宏块的先前估计的运动向量来产生所述预测的种 子运动向量。可以利用分级的搜索来产生所述分级的种子向量。在一些实施例中,产生所述分级的种子向量可包括利用预定的抽取 因子来抽取输入宏块;并且利用所述预定的抽取因子从视频序列中抽取参考帧。在一些实施例中,可以利用所本文档来自技高网
...

【技术保护点】
一种用于视频序列中的运动估计的方法,包括:产生利用预测的种子运动向量编码成本而编码的预测的种子运动向量;产生利用分级的种子运动向量编码成本而编码的分级的种子运动向量;基于对所述预测的种子运动向量编码成本和所述分级的种子运动向量编码成本的比较,为全像素搜索选择所述预测的种子运动向量、所述分级的种子运动向量或者两者;对于每个被选择的所述种子运动向量执行所述全像素搜索,以基于全像素运动向量的编码成本选择所述全像素运动向量;以及 利用被选择的所述全像素运动向量,执行分数像素搜索,以 估计最终的运动向量。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:马克霍夫曼张伟拉卡辛格宁柯
申请(专利权)人:模拟装置公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1