一种基于贝叶斯决策的HEVC块划分快速方法技术

技术编号:15442382 阅读:132 留言:0更新日期:2017-05-26 07:15
本发明专利技术公开了一种基于贝叶斯决策的HEVC块划分快速方法。本发明专利技术首先利用基于平均灰度差值的场景变换检测将视频序列分成在线学习阶段和快速划分阶段。其次对于在线学习阶段和发生场景变换的视频帧,在每一个划分深度,分别提取CU的J

A fast method for HEVC block partition based on Bayes decision

The invention discloses a fast method for HEVC block division based on Bayes decision. The invention first detects the video sequence into an online learning stage and a rapid division stage by using scene transformation detection based on the average gray difference. Secondly, for the online learning phase and scene transformation video frames, the CU of each J is extracted at each depth of division

【技术实现步骤摘要】
一种基于贝叶斯决策的HEVC块划分快速方法
本专利技术属于高清数字视频压缩编解码
,尤其涉及一种基于贝叶斯决策的HEVC(HighEfficiencyVideoCoding,高效视频编码)块划分快速方法。
技术介绍
在数字视频应用产业链的快速发展中,面对视频应用不断向高清晰度、高帧率、高压缩率方向发展的趋势,上一代视频压缩标准协议H.264/AVC的局限性不断突显。因此,由国际电信组织(ITU-T)和运动图像专家组(MPEG)联合成立的组织JCT-VC提出了下一代视频编解码标准——H.265/HEVC。其目标是在相同的图像质量前提下,压缩率比H.264/AVC高档次提高一倍。HEVC在编码原理和基本结构方面没有突破,和H.264/AVC基本一致,即预测加变换的分块编码方式;在编码细节上和H.264/AVC也很接近,包含帧内预测、帧间预测、运动估计与补偿、正交变换、量化、环路滤波、熵编码和重建等编解码模块。但是,和H.264/AVC相比较,HEVC几乎在每一个编码环节上都采取了重要的改进措施,如帧内预测支持35种模式、帧间预测引入Merge模式、变换量化支持高达32×32变换单元、熵编码采用CABAC(ContextAdaptiveBinaryArithmeticCoder,基于上下文的自适应二进制算术编码)算法、新引入的自适应样点补偿环路滤波等等。HEVC编码器采用了编码树单元(CTU,CodingTreeUnit)、编码单元(CU,CodingUnit)、预测单元(PU,PredictionUnit)、变换单元(TransformUnit,TU)结构,使得HEVC能够对不同分辨率和应用环境的视频进行编码。HEVC编码时,一幅图像可以被划分为多个互不重叠的CTU,每个CTU划分为一个或者多个CU;在进行帧内或者帧间预测编码时,一个CU可以选择划分为一个或者多个PU;在变换、量化操作时,一个CU可以划分成一个或者多个TU。CU是HEVC编码的基本单元,采用递归的划分方式。HEVC支持8×8、16×16、32×32、64×64这4种尺寸的CU,对应的划分深度分别为3、2、1、0。PU是HEVC预测的基本单元,规定了CU的预测模式,所有与预测相关的编码数据都由PU传输的。对于一个尺寸为2N×2N的CU,其帧内PU的可选模式有2种:2N×2N和N×N;帧间PU的可选模式有8种,其中包括4种对称模式:2N×2N、2N×N、N×2N、N×N以及4种非对称模式:2N×nD、2N×nU、nR×2N、nL×2N。当编码时采用Merge时,残差信息是不需要被编码的,此时采用的PU模式为2N×2Nskip模式,PU划分模式如图1所示。TU是HEVC变换和量化的基本单元,其尺寸大小也是灵活变化的,以四叉树形式进行递归分割。当CTU尺寸为64×64时,各个CU中TU的四叉树递归划分如图2所示,其中CU的划分用实线表示,TU的划分用虚线表示,编码顺序用字母编号表示。与其他的国际编码标准类似,HM编码器对于块尺寸的决策也是基于率失真优化(Rate-DistortionOptimization,RDO)的,在HEVC标准编码算法中,CU的划分流程简述如下:(1)设置当前CU的深度为零;(2)计算在当前划分深度下Skip模式的率失真代价(Rate-DistortionCost,RDCost)Jskip,并且更新当前最佳的划分模式(BestCuMode=Skip)和最小的率失真代价(MinRDcost=Jskip);(3)计算在当前划分深度下Merge_2Nx2N模式的率失真代价Jmerge_2Nx2N,并与之前得出的最小的率失真代价做比较,若Jmerge_2Nx2N<MinRDcost,更新当前最佳的划分模式(BestCuMode=Merge_2Nx2N)和最小的率失真代价(MinRDcost=Jmerge_2Nx2N);(4)计算在当前划分深度下Inter_2Nx2N模式的率失真代价JInter_2Nx2N,并与之前得出的最小的率失真代价做比较,若JInter_2Nx2N<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_2Nx2N)和最小的率失真代价(MinRDcost=JInter_2Nx2N);(5)若当前CU的深度是编码器允许的最大划分深度,而且CU的尺寸比8×8大,则求Inter_NxN模式的率失真代价Jlnter_NxN,并与之前得出的最小的率失真代价做比较,若Jlnter_NxN<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_NxN)和最小的率失真代价(MinRDcost=JInter_NxN),若不满足上述CU深度和尺寸要求,则跳过步骤5;(6)计算在当前划分深度下Inter_2NxN模式的率失真代价JInter_2NxN,并与之前得出的最小的率失真代价做比较,若Jinter_2NxN<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_2NxN)和最小的率失真代价(MinRDcost=JInter_2NxN);(7)计算在当前划分深度下Inter_Nx2N模式的率失真代价JInter_Nx2N,若JInter_Nx2N<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_Nx2N)和最小的率失真代价(MinRDcost=JInter_Nx2N);(8)计算当前CU是否需要计算AMP模式的率失真代价,如果BestCuMode=Inter_2Nx2N或者BestCuMode=Inter_2NxN,Test_Hor条件为真,否则Test_Hor为假;如果BestCuMode=Inter_2Nx2N或者BestCuMode=Inter_Nx2N,Test_Ver条件为真,否则Test_Ver为假。(9)如果Test_Hor条件为真,继续下一步;否则,跳转到步骤12;(10)计算在当前划分深度下Inter_2NxnU模式的率失真代价JInter_2NxnU,若JInter_2NxnU<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_2NxnU)和最小的率失真代价(MinRDcost=JInter_2NxnU);(11)计算在当前划分深度下Inter_2NxnD模式的率失真代价JInter_2NxnD,若JInter_2NxnD<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_2NxnD)和最小的率失真代价(MinRDcost=JInter_2NxnD);(12)若Test_Ver条件为真,继续下一步;否则,跳转到步骤15;(13)计算在当前划分深度下Inter_nLx2N模式的率失真价JInter_nLx2N,若JInter_nLx2N<MinRDcost,更新当前最佳的划分模式(BestCuMode=Inter_nLx2N)和最小的率失真代价(MinRDcost=JInter_nLx2N);(14)计算在当前划分深度下Inter_nRx2N模式的率失真代价JInter_nRx2N,若JInte本文档来自技高网...
一种基于贝叶斯决策的HEVC块划分快速方法

【技术保护点】
一种基于贝叶斯决策的HEVC块划分快速方法,其特征在于将CU划分操作看作二分类问题,即W={ω

【技术特征摘要】
1.一种基于贝叶斯决策的HEVC块划分快速方法,其特征在于将CU划分操作看作二分类问题,即W={ωN,ωP},其中ωN表示当前CU不继续划分,ωp表示当前CU继续划分,并采用最小风险贝叶斯决策来解决二分类问题,具体实现步骤如下:步骤1、离线学习得到损失函数CNP和CPN以及先验概率P(ωN)和P(ωP);步骤2、对于传入的图片序列,判断其是否处于在线学习阶段或者场景是否发生了变化,若当前帧处于在线学习阶段或者是场景变换帧,根据HM标准算法对其进行深度划分,提取并存储每个深度的特征值,跳转到步骤7;否则执行步骤3;步骤3、判断图片是否为快速划分阶段的第一帧图像,若不是,执行步骤4;否则提取在线学习阶段或场景变换帧存储的特征值,并基于特征值建立混合高斯模型,模型的统计参数用以K-Means算法初始化的EM算法来估计;步骤4、提取当前CU的特征值,求得p(X|ωR)R∈{N,P};提取待划分的CU的特征值X,根据所处深度求得在同深度的混合高斯分布上的函数值,即p(X|ωN)和p(X|ωP);步骤5、决定是否划分当前CU,若划分,对每一个Sub-CU执行步骤1-步骤5所述过程;否则不划分当前CU,跳到步骤6;针对当前CU划分的判断如下:计算比较和大小,若较大,将当前CU划分为四个Sub-CU,并对每一个Sub-CU执行步骤1-5;步骤6、对该CU进行编码,若当前帧图像CU已经划分完成,执行步骤7;否则,对下一个CU执行步骤1-6所述过程;步骤7、对下一帧图像执行2-7步骤所述过程,直至编码完所有的视频帧。2.根据权利要求1所述的一种基于贝叶斯决策的HEVC块划分快速方法;其特征在于步骤1具体过程如下:提出将错误决策带来的率失真性能的下降作为贝叶斯风险函数,建立基于最小风险的贝叶斯决策模型,以降低错误决策带来的率失真性能损失,完全率失真代价函数如下式所示:JFRD=(SSEluma+ωchroma×SSEchroma)+λmode×Bmode其中,SSEluma,表示亮度的原始图像块和重建图像块之间的像素差误差平方和;SSEchroma表示色度信号的原始图像块和重建图像块之间的像素差误差平方和,ωchroma为色度分量的权重系数,λmode是拉格朗日乘数,Bmode是对当前编码模式时所需要的比特数;对于64×64,32×32,16×16大小的CU,分别通过离线学习训练得到损失矩阵C,损失矩阵定义如下式所示:此处CPN和CNP定义如下:JFRD,N和JFRD,P分别是当前待划分CU不继续划分和继续划分成四个子块对应的完全率失真代价;CNP表示假设ωN为真,即率失真结果为“不划分”时判断假设ωP成立,即对CU采取“划分”决策时所带来的风险代价;CPN表示假设ωP为真,对CU采取“不划分”决策时所带来的风险代价;CNP和CPN大于等于0,当决策是正确的时候(CNN或CPP),决策的损失值为0;先验概率P(ωR)是通过统计当前深度下,作出ωR决策的CU占所有CU的比重得到的,即P(ωR)=当前深度属于ωR的CU数/当前深度CU总数;其中R为N或者P。3.根据权利要求2所述的一种基于贝叶斯决策的HEVC块划分快速方法;其特征在于步骤2具体实现如下:用平均灰度差值来衡量视频运动的剧烈程度,即是否发生场景变换,视频序列中相邻两帧在相同位置上的像素点的平均灰度差值计算如下式所示:

【专利技术属性】
技术研发人员:姚英彪贾天婕杨旭
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1