当前位置: 首页 > 专利查询>同济大学专利>正文

基于最优停止理论的编码模式快速自动选择方法技术

技术编号:8389287 阅读:330 留言:0更新日期:2013-03-07 21:24
本发明专利技术涉及一种基于最优停止理论的编码模式快速自动选择方法,该方法包括以下步骤:1)将N个候选模式映射为持续问题中的N个变量,并获取当前待编码宏块在每个模式下对应的概率pk;2)将N个候选模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各候选模式,计算并获得最佳编码模式和最优停止点;4)根据当前最佳编码模式和最优停止点更新参数,并返回步骤1),直至整个视频序列编码完成。与现有技术相比,本发明专利技术具有可缩短编码时间、降低计算量、实用性强等优点。

【技术实现步骤摘要】

本专利技术涉及一种视频编码方法,尤其是涉及一种基于最优停止理论的编码模式快速自动选择方法
技术介绍
随着人们对视觉体验的要求越来越高,市场上出现了三维电视(3DTV)和自由视点电视(FTV)等新兴电子设备,多视点视频编码标准Multi-view Video Coding(MVC)应运而生。MVC通过一组摄像头从不同角度对同一场景进行拍摄,得到的视频数据为3DTV和FTV提供视频源数据。一般来说,视频序列中存在大量的冗余信息,主要分为以下三种:空间冗余信息、时间冗余信息和统计冗余信息。视频编码技术通过有效合理地去除这些冗余信息,从而达到视频压缩的目的。在视频编码中,一般通过帧间编码技术对Predicted frames(P帧)和Bi-directional predictive frames(B帧)进行编码。B、P帧与前后帧之间存在大量相似内容:编码B帧时,通过参考前后两个方向的已编码帧来去除时间冗余;编码P帧时,只参考前面一个方向的已编码帧;以上方法可以去除大量的时间冗余信息。一般通过帧内编码技术对Intra coded frames(I帧)进行编码,I帧不参考其他帧的信息,只利用自身的信息进行编码。由于相邻像素之间像素值紧密相关,可以通过邻近像素对当前像素进行预测以去除空间冗余信息。对于预测之后得到的残差信号利用信源的统计信息进行变换、量化和熵编码,从而进行高效压缩。和H.264/AVC单视点视频编码标准相比,MVC必须处理和摄像机数量成比例的数据量,这个数据量是极大的。在网络带宽等系统资源有限的情况下,如何有效处理如此巨大的数据量成为MVC应用的一个瓶颈。除了前面所提的三种冗余信息外,MVC还存在着一种不可忽视的冗余信息,即为视差冗余信息。由于每个摄像头都是对同一场景进行拍摄,所不同的仅仅是对场景的取景角度,所以不同摄像头所得到的视频序列间存在大量相似信息。对于视差冗余信息,一般利用视差估计来去除视差冗余信息。作为H.264/AVC的扩展,MVC中宏块大小的划分也是灵活可变的。在MVC中,有7种宏块划分大小,分别是:16×16(像素为单位)、16×8、8×16、8×8、8×4、4×8、4×4,如图1所示。一般对于细节较少、图像变化较平缓的区域,选择的块尺寸会大一些;对于图像中细节较多的区域选择的块尺寸会小一些。对帧间预测而言,每个宏块都要进行运动估计,并且相应地有一个运动矢量,也就是空间位置的相对偏移量,在解码端通过运动矢量指明的位置,从已经解码得到的邻近参考帧中得到对应的块,和预测残差相加后就得到所需要解码的块。另外,如果宏块进行视差估计,会相应地有一个视差矢量,视差是指同一个点在不同视点的对应图像中投影点之间的位置偏差,包括各摄像机的相对运动及场景中对象的运动所产生的差异。在解码端通过视差矢量,可以从参考视点的对应宏块得到所要解码的宏块。如果宏块划分地很细致,那么所得到的子块数量会增多,相应的运动矢量/视差矢量也会增多,用来表示运动矢量/视差矢量的比特数也相应地增加,需编码的视频信息量就会变大,所以如何选择宏块尺寸大小就显得极为重要。在视频编码中,不仅存在不同大小的宏块,每一个宏块还有Intra,Inter,SKIP三种可选编码方式。Intra模式又包含Intra4×4、Intra8×8和Intra16×16三种。对宏块的亮度分量而言,Intra4×4和Intra8×8分别有9种预测方向,分别是:垂直预测、水平预测、平均预测、左对角预测、右对角预测、垂直右对角预测、水平向下预测、垂直左对角预测和水平向上预测。对于Intra16×16存在4种预测方向,分别是:水平预测、垂直预测、平均预测和平面预测。对于宏块的Intra8×8色度块预测,存在的4种预测方向和Intra16×16的4种预测方向相同,并且两种色度成分常用同一种预测方向。在如此众多的预测方式中,如何选择最佳方式对当前宏块进行编码是极为重要的。最简单的方法是遍历所有模式,从中选出一个最佳的方式,这样就存在一个选择标准。在MVC中,采用拉格朗日率失真优化策略(Rate Distortion Optimization,RDO)作为评价准则,即通过遍历所有可能的模式,最后选择率失真代价最小的模式作为最佳编码模式,公式为:J(s,c,m|QP,λm)=D(s,c,m|QP)+λmR(s,c,m|QP)式中,QP是宏块的量化参数;λm是拉格朗日常数,与QP有关;D是原始像素块s与重建像素块c之间的失真;R是利用模式m进行编码的比特数。对每一个宏块,MVC都需要从以上的模式中选择出最佳的模式进行编码。遍历所有模式一方面可以提高MVC的压缩率和视频质量,另一方面又不可避免地增加了编码计算复杂度,具体表现在编码时间极长。这就需要快速算法来缩短编码时间以满足实际需要,同时又在一定范围内满足视频质量的要求。最优停止理论问题可以归结如下:存在一个联合分布已知的随机变量的序列和一组实值奖励函数,决策者按照顺序检查这些变量,同时获得相应的奖励函数值,并且在合适的时间停止检查余下的变量,最终的目的是在最短的检查时间内,使获得的奖励函数值最大,在这种情况下获得的候选变量是最佳的概率也最大。在最优停止理论的研究过程中,Ferguson等人提出了名为“持续问题”的最优停止问题,简单叙述为:在决策的过程中,如果某个变量比其他变量的观测值更好,那么它便成为一个相对最佳目标(Relative Best Object,RBO)。持续问题的目标是在遇到下一个RBO之前,找到一个适当的时间停止观测,同时获得的变量具有最大观测值。持续问题的期望值越大,表明在停止点之后遇到下一个RBO的时间越长,同时能够节省的不必要时间开销也越多。换句话说,持续问题的解决方法在判定准确性和时间减少比例上能够很好地进行权衡,这点可以借鉴到视频编码的快速算法中,相对应的是既要尽可能选择到编码的最佳模式,同时又要尽量减少编码时间,这和持续问题的目的很相似。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种可缩短编码时间、降低计算量、实用性强的基于最优停止理论的编码模式快速自动选择方法。本专利技术的目的可以通过以下技术方案来实现:一种基于最优停止理论的编码模式快速自动选择方法,该方法包括以下步骤:1)将N个候选模式映射为持续问题中的N个变量,并获取当前待编码宏块在每个模式下对应的概率pk(k=1,2,...,N);2)将N个候选模式按其概率本文档来自技高网
...

【技术保护点】
一种基于最优停止理论的编码模式快速自动选择方法,其特征在于,该方法包括以下步骤:1)将N个候选模式映射为持续问题中的N个变量,并获取当前待编码宏块在每个模式下对应的概率pk(k=1,2,...,N);2)将N个候选模式按其概率降序排列;3)应用最优停止理论根据步骤2)的顺序依次检查各候选模式,计算并获得最佳编码模式和最优停止点;4)根据当前最佳编码模式和最优停止点更新参数,并返回步骤1),直至整个视频序列编码完成。

【技术特征摘要】
1.一种基于最优停止理论的编码模式快速自动选择方法,其特征在于,该方
法包括以下步骤:
1)将N个候选模式映射为持续问题中的N个变量,并获取当前待编码宏块在
每个模式下对应的概率pk(k=1,2,...,N);
2)将N个候选模式按其概率降序排列;
3)应用最优停止理论根据步骤2)的顺序依次检查各候选模式,计算并获得
最佳编码模式和最优停止点;
4)根据当前最佳编码模式和最优停止点更新参数,并返回步骤1),直至整个
视频序列编码完成。
2.根据权利要求1所述的一种基于最优停止理论的编码模式快速自动选择方
法,其特征在于,所述的当前待编码宏块在每个模式下对应的概率pk通过以下公
式获取:
pk=Tu(Mu,k)+Tl(Ml,k)+Tf(Mf,k)+Tb(Mb,k)Σr=1NTu(Mu,r)+Tl(Ml,r)+Tf(Mf,r)+Tb(Mb,r)]]>其中,Tu(Mu,k)为当前待编码宏块的上方宏块最佳编码模式为Mu时,当前待
编码宏块最佳编码模式为k的概率预测矩阵;Tl(Ml,k)为当前待编码宏块的左方宏
块最佳编码模式为Ml时,当前待编码宏块最佳编码模式为k的概率预测矩阵;
Tf(Mf,k)为当前待编码宏块的前一视点相同位置处的宏块最佳编码模式为Mf时,
当前待编码宏块最佳编码模式为k的概率预测矩阵;Tb(Mb,k)为当前待编码宏块的

【专利技术属性】
技术研发人员:王瀚漓衡岳
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1