一种场编码模式的多参考场快速运动估计方法及系统技术方案

技术编号:10404231 阅读:147 留言:0更新日期:2014-09-10 13:34
本发明专利技术公开了一种场编码模式的多参考场快速运动估计方法及系统,其中,该方法包括:根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场;比较当前最佳参考场对应的最佳运动矢量中的垂直分量与阈值T的大小;若垂直分量的绝对值小于等于阈值T,则后续参考场运动估计范围的垂直分量为T;否则,后续参考场运动估计范围的垂直分量为kT。通过采用本发明专利技术公开的方法,可以有效地减少支持多参考场视频编码器的复杂度,从而使得某些计算资源有限的设备也能有效地利用该视频编码技术,进而有效提高用户体验质量。

【技术实现步骤摘要】
一种场编码模式的多参考场快速运动估计方法及系统
本专利技术涉及视频编码领域,尤其涉及一种场编码模式的多参考场快速运动估计方法及系统。
技术介绍
近年来,移动通信技术快速发展,新的通信系统、无线局域网、无线城域网等技术也随之不断发展,使网络传输速度得到了很大的提升。同时,随着人们对于视频等多媒体通信的需求越来越高,以视频通信为基础的多媒体信息传输和服务业务也逐渐成为未来宽带移动业务发展的主流。然而,与传统的语音信号相比,原始视频信号占用的带宽要大很多,如果直接传输原始视频信号则需要极其高的带宽,现有的信道根本无法满足要求。从上个世纪九十年代以来,国际标准化组织(ISO)和国际电信联盟(ITU)联合制定了一系列关于视频压缩编解码的国际标准和建议,其中,ISO推出的MPEG系列国际标准和ITU提出的H.26X系列视频压缩标准影响最大。在2001年,ITU和ISO组建了联合视频工作组,简称JVT,开始致力于一套新的视频编解码标准——JVT/H.264/AVC,简称H.264/AVC。2003年,H.264/AVC正式成为国际标准。通过去除视频序列中存在的各种冗余,视频编码压缩技术可以更高效地表达视频内容。视频序列中的冗余主要包括视觉冗余、空间冗余和时间冗余。由于适当地降低重建视频的质量可以极大地降低编码码率,除了某些特定用途外,大部分的应用场景下的视频编码都属于有损编码,即重建信号和原始信号并不完全一致。与之前的标准类似,H.264/AVC标准仍然采用混合编码框架,主要包括预测、变换、量化、熵编码和环路滤波等部分。相比先前的视频编码标准MPEG-4、H.263和MPEG-2,在保持视频质量不变情况下,H.264/AVC标准分别可以节省39%、49%和64%的码率。为了提高编码效率,H.264/AVC相比之前的编码标准,增加了很多新的工具以获得更高的压缩效率,然而,在提高压缩性能的同时,其编码复杂度也远远高于先前的标准,这给实时编解码需求的应用(比如:视频会议、手机视频通信等)带来了很大的挑战。因而,提高H.264/AVC的编码速度有着重要的应用意义。在H.264/AVC的多个编码过程中,运动估计特别是多参考帧运动估计的时间占到了整个编码时间的90%以上,如果我们能缩短该过程的耗时,那整个编码过程的时间将大大降低。H.264/AVC中存在着两种编码模式:帧编码和场编码。帧编码就是逐帧地对视频序列进行编码,这是比较主流的编码模式。而场编码,就是将视频序列的某一帧分成两部分,如图1所示,该帧的奇数行构成一部分,称为顶场;该帧的偶数行构成另一部分,称为底场。在场编码模式中,每一帧的顶场和底场单独进行编码。相比帧编码,对于运动比较剧烈的视频区域,相邻帧之间的相关性比较低,帧编码无法获得很高的编码效率,而在这种情况下,同一帧的相邻场之间的相关性仍然很高,通过场编码仍可以获得比较高的编码效率。另外,场编码所要求的带宽比较低,在有线电视等领域应用比较广泛。但是,在相同参考帧数的编码条件下,场编码进行多参考帧运动估计所需要参考的场数是帧数的两倍,因而其编码复杂度相比帧编码又大大提高。综合以上观点,降低场编码模式的多参考场运动估计的编码时间是非常有必要的。然而,目前在H.264/AVC中的比较典型的一些快速运动估计算法都只是针对帧编码进行设计的,而并未充分考虑到场编码模式参考场的不同特性,因而在某些需求场编码模式的应用时,无法充分降低编码时间。
技术实现思路
本专利技术的目的是提供一种场编码模式的多参考场快速运动估计方法及系统,可以有效降低支持多参考场视频编码器的复杂度。本专利技术的目的是通过以下技术方案实现的:一种场编码模式的多参考场快速运动估计方法,该方法包括:根据当前宏块参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场;比较当前最佳参考场对应的最佳运动矢量中的垂直分量与阈值T的大小;若垂直分量的绝对值小于等于阈值T,则后续参考场运动估计范围的垂直分量为T;否则,后续参考场运动估计范围的垂直分量为kT。进一步的,所述根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场包括:若当前宏块处于顶场,则比较当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小,选择率失真代价较小者对应的场作为当前最佳参考场;若当前宏块处于底场,则以当前帧的顶场作为参考场进行运动估计,搜索范围为[±kT,±T],其中,k=3;若经运动搜索获得最佳运动矢量为(0,0),且重建像素值与原始像素值差的绝对值之和SAD小于阈值TSAD,则运动估计过程结束;否则,比较当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小,选择率失真代价较小者对应的场作为当前最佳参考场。进一步的,所述根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场包括:若当前宏块处于顶场,则以当前参考帧的顶场作为参考场,进行运动估计获得该参考帧顶场的最佳运动矢量MVtop;并根据该参考帧顶场的最佳运动矢量MVtop估算出该参考帧底场的最佳运动矢量MV'bottom;比较最佳运动矢量MVtop的率失真代价Jtop(MVtop,λmotion)与最佳运动矢量MV'bottom的率失真代价J'bottom(MV'bottom,λmotion)的大小,选择率失真代价较小者对应的场作为当前最佳参考场;其中,λmotion为拉格朗日乘数;若当前宏块处于底场,则以当前参考帧的底场作为参考场,进行运动估计获得该参考帧底场的最佳运动矢量MVbottom;并根据该参考帧底场的最佳运动矢量MVbottom估算出该参考帧顶场的最佳运动矢量MV'top;比较最佳运动矢量MVbottom的率失真代价Jbottom(MVbottom,λmotion)与最佳运动矢量MV'top的率失真代价J'top(MV'top,λmotion)的大小,选择率失真代价较小者对应的场作为当前最佳参考场。进一步的,所述阈值TSAD的计算方法包括:TSAD=(min{SADleft,SADup,SADupright}>>8)×Bx×By;其中,SADleft、SADup与SADupright分别表示当前宏块左边块、上边块与右上边块的SAD,这三个块的大小均为16x16;当前宏块的大小为Bx×By。进一步的,所述根据该参考帧顶场的最佳运动矢量MVtop估算出该参考帧底场的最佳运动矢量MV'bottom,或者所述根据该参考帧底场的最佳运动矢量MVbottom估算出该参考帧顶场的最佳运动矢量MV'top包括:不进行整像素的运动搜索,直接根据顶场或底场的最佳运动矢量来估算对应底场或顶场运动矢量的整像素,表示为:((MVx/4)×4,(MVy/4)×4);再进行子像素的运动估计;其中,MVx表示运动矢量的水平分量,MVy表示运动矢量的垂直分量;/为整数除,计算结果为整数。一种场编码模式的多参考场快速运动估计系统,该系统包括:当前最佳参考场确定模块,用于根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场;垂直分量确定模块,用于比较当前最佳参考场对应的最佳运动矢量中的垂直分量与阈值T的大小;若垂直分本文档来自技高网
...
一种场编码模式的多参考场快速运动估计方法及系统

【技术保护点】
一种场编码模式的多参考场快速运动估计方法,其特征在于,该方法包括:根据当前宏块参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场;比较当前最佳参考场对应的最佳运动矢量中的垂直分量与阈值T的大小;若垂直分量的绝对值小于等于阈值T,则后续参考场运动估计范围的垂直分量为T;否则,后续参考场运动估计范围的垂直分量为kT。

【技术特征摘要】
2014.04.30 CN 201410182516.21.一种场编码模式的多参考场快速运动估计方法,其特征在于,该方法包括:根据当前宏块参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场;比较当前最佳参考场对应的最佳运动矢量中的垂直分量与阈值T的大小;若垂直分量的绝对值小于等于阈值T,则后续参考场运动估计范围的垂直分量为T;否则,后续参考场运动估计范围的垂直分量为kT,k为大于1的整数。2.根据权利要求1所述的快速运动估计方法,其特征在于,所述根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场包括:若当前宏块处于顶场,则比较当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小,选择率失真代价较小者对应的场作为当前最佳参考场;若当前宏块处于底场,则以当前帧的顶场作为参考场进行运动估计,搜索范围为[±kT,±T],其中,k=3;若经运动搜索获得最佳运动矢量为(0,0),且重建像素值与原始像素值差的绝对值之和SAD小于阈值TSAD,则运动估计过程结束;否则,比较当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小,选择率失真代价较小者对应的场作为当前最佳参考场。3.根据权利要求1或2所述的快速运动估计方法,其特征在于,所述根据当前宏块所处帧的当前参考帧的顶场与底场最佳运动矢量对应的率失真代价的大小来确定当前最佳参考场包括:若当前宏块处于顶场,则以当前参考帧的顶场作为参考场,进行运动估计获得该参考帧顶场的最佳运动矢量MVtop;并根据该参考帧顶场的最佳运动矢量MVtop估算出该参考帧底场的最佳运动矢量MV'bottom;比较最佳运动矢量MVtop的率失真代价Jtop(MVtop,λmotion)与最佳运动矢量MV'bottom的率失真代价J'bottom(MV'bottom,λmotion)的大小,选择率失真代价较小者对应的场作为当前最佳参考场;其中,λmotion为拉格朗日乘数;若当前宏块处于底场,则以当前参考帧的底场作为参考场,进行运动估计获得该参考帧底场的最佳运动矢量MVbottom;并根据该参考帧底场的最佳运动矢量MVbottom估算出该参考帧顶场的最佳运动矢量MV'top;比较最佳运动矢量MVbottom的率失真代价Jbottom(MVbottom,λmotion)与最佳运动矢量MV'top的率失真代价J'top(MV'top,λmotion)的大小,选择率失真代价较小者对应的场作为当前最佳参考场。4.根据权利要求2所述的快速运动估计方法,其特征在于,所述阈值TSAD的计算方法包括:TSAD=(min{SADleft,SADup,SADupright}>>8)×Bx×By;其中,SADleft、SADup与SADupright分别表示当前宏块左边块、上边块与右上边块的SAD,这三个块的大小均为16x16;当前宏块的大小为Bx×By。5.根据权利要求3所述的快速运动估计方法,其特征在于,所述根据该参考帧顶场的最佳运动矢量MVtop估算出该参考帧底场的最佳运动矢量MV'bottom,或者所述根据该参考帧底场的最佳运动矢量MVbottom估算出该参考帧顶场的最佳运动矢量MV'top包括:不进行整像素的运动搜索,直接根据顶场或底场的最佳运动矢量来估算对应底场或顶场运动矢量的整像素,表示为:((MVx/4)×4,(MVy/4)×4);再进行子像素的运动估计;...

【专利技术属性】
技术研发人员:陈方栋张金雷李厚强王峰
申请(专利权)人:中国科学技术大学上海高清数字科技产业有限公司
类型:发明
国别省市:安徽;34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1