当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于决策树的帧间快速模式选择方法技术

技术编号:18240910 阅读:59 留言:0更新日期:2018-06-17 05:54
本发明专利技术公开了一种基于决策树的帧间快速模式选择方法,通过获取相关性较好的特定位置的CU信息,首先进行决策树预测得出的最佳模式的预测编码,并实时获取当前CU编码后的一些信息,利用时域和空域信息的相关性,与周边CU的相关信息结合,对帧间编码模式的个数和顺序进行细致调整。该方案提前对帧间模式进行预测,并在帧间模式的预测过程中实时调整模式顺序,跳过不必要的模式预测,大幅度地缩短了帧间预测的时间,从而减少了编码时间;且该方法简单易行,有利于新一代视频编码标准的产业化推广。 1

A fast inter frame mode selection method based on decision tree

The invention discloses a fast pattern selection method based on decision tree. By obtaining the CU information of a specific location, the best pattern prediction coding is obtained by the decision tree, and some information after the current CU coding is obtained in real time, and the correlation between the time domain and the spatial information is used and the peripheral C is used. Combining the relevant information of U, the number and order of interframe coding mode are carefully adjusted. This scheme predicts the inter frame mode in advance, and adjusts the pattern sequence in real time in the process of inter frame model prediction, skip the unnecessary pattern prediction, greatly shortens the time of inter frame prediction and reduces the coding time, and this method is simple and easy to use, which is beneficial to the industrialization of the new generation video coding standard. . One

【技术实现步骤摘要】
一种基于决策树的帧间快速模式选择方法
本专利技术涉及视频编解码领域,特别涉及一种基于决策树的帧间快速模式选择方法。
技术介绍
在视频编码技术中,帧间预测是编码的核心技术之一。帧间预测是根据视频图像的时间相关性,利用已经编码的图像的相关信息预测待编码图像,然后对预测后的残差进行变换、量化、熵编码等一系列操作,而不是对原始像素值进行直接编码。经过帧间编码后,视频图像间的时间相关性大大消除,编码复杂度大大降低,同时编码效率显著提高。2013年,ITU-T的VCEG(视频编码专家组)和ISO/IEC的MPEG(动态图像专家组)联合推出了HEVC(高效视频编码)视频压缩方案。自2016年始,VCEG和MPEG开始研究新一代视频编码器,并成立了一个专家小组——JVET(联合视频研究小组),旨在进一步提升HEVC的压缩率。新一代视频编码器的最新编码软件JEM是在HM的框架上发展而来,沿用了HEVC的基本框架,但是在每个模块内部引入了许多新的技术和工具。这些工具的引入对压缩率和视频质量的提升起了一定作用,却加大了编码的复杂度,使之实际应用性能更差。在新一代编码标准JEM中加入了新的帧间预测模式,帧间预测步骤如下:步骤一:进行AffineMerge模式。对AffineMerge模式进行率失真代价的计算,并将AffineMerge模式设为最优模式。步骤二:判断最优模式是否为2Nx2NMerge模式。对2Nx2NMerge模式进行率失真代价的计算,若其率失真代价较当前最优模式的率失真代价更小,则将2Nx2NMerge模式选为最优模式。步骤三:判断最优模式是否为FRUCMerge模式。其中FRUCMerge模式又包括Bilateral和Template两个子模式。对FRUCMerge模式进行率失真代价的计算,若其率失真代价较当前最优模式的率失真代价更小,则将FRUCMerge模式选为最优模式,并用标志位表示最优模式属于哪一种子模式。步骤四:判断最优模式是否为2Nx2N模式。对2Nx2N模式下的率失真代价进行计算,若其率失真代价较当前最优模式的率失真代价更小,则将2Nx2N模式选为最优模式。步骤五:进行帧内预测模式的判断。帧间模式的预测占据了编码总时间的一半以上,因此对帧间模式预测的改进是十分必要的。如果能通过相关信息调整帧间模式的顺序,并预测出最优可能选择的模式,避免对所有模式的遍历,跳过一些选择可能性很低的模式,将会大大减少编码时间,降低编码复杂度。
技术实现思路
本专利技术是针对JEM编码器中帧间模式较多,编码时间过长且编码效率过低的缺陷提出的一种基于决策树的帧间快速模式选择方法。一种基于决策树的帧间快速模式选择方法,包括以下步骤:步骤1:构建当前编码单元CU最佳预测模式分类器;从国际标准测试序列中随机选取四个视频测试序列,在所选的四个测试序列的100帧的编码信息中,获取当前编码单元CU的左邻块CULeft、上邻块CUAbove以及同位块CUCol的相关信息;以CULeft、CUAbove、CUCol的最佳模式,CUCol的MV,CUCol的残差和编码QP值,当前编码单元CU的平均像素作为输入数据,以当前编码单元CU的最佳预测模式作为输出数据,选择10重交叉验证,对weka中的J48决策树进行训练,得到基于决策树的当前编码单元CU最佳预测模式分类器;步骤2:获取编码过程中当前编码单元CU的最佳预测模式预估值mode(P);提取编码过程中,当前编码单元的CULeft、CUAbove、CUCol的最佳模式,CUCol的MV,CUCol的残差和编码QP值以及当前编码单元CU的平均像素,输入至步骤1构建的构建当前编码单元CU最佳模式分类器,获取编码过程中当前编码单元CU的最佳预测模式预估值mode(P);步骤3:获取左邻块CULeft、上邻块CUAbove以及同位块CUCol的最佳预测模式modej,以及在对应最佳预测模式下的失真Dj和率失真代价RDj,若mode(P)与modej均不为AffineMerge模式,进入步骤4,否则,依次进行所有帧间模式的预测后,进入步骤9;步骤4:统计相同最佳预测模式的个数i,其中,j表示Left、Above、Col;步骤5:依据i的取值,获取当前编码单元CU的最佳预测模式候选值;步骤6:对当前编码单元CU进行AffineMerge模式的预测,并将AffineMerge模式标记为当前编码单元CU的当前最佳模式mode*,同时将AffineMerge模式下的率失真代价标记为当前最佳率失真代价RD*;步骤7:对当前编码单元CU进行mode(P)的预测,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;步骤8:基于当前编码单元CU的最佳预测模式预估值mode(P),再依次对当前编码单元CU的最佳预测模式候选值进行模式预测,在每次模式预测后,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;在各种i的取值下,基于当前编码单元CU的最佳预测模式预估值mode(P),依次选择当前编码单元CU的最佳预测模式候选值进行模式预测,从而结束当前编码单元帧间模式的预测。进一步地,所述当前编码单元CU的最佳预测模式候选值的获取过程如下:1)若i=0,按照失真Dj从小到大对左邻块CULeft、上邻块CUAbove以及同位块CUCol排列,并将排列后的左邻块CULeft、上邻块CUAbove以及同位块CUCol对应的最佳预测模式依次标记为第一最佳预测模式候选值mode(X)、第二最佳预测模式mode(Y)、第三最佳预测模式mode(Z);2)若i=2,将左邻块CULeft、上邻块CUAbove以及同位块CUCol中的相同模式标记为第一最佳预测模式mode(X),不同的模式标记为第二最佳预测模式mode(Y);3)若i=3,将左邻块CULeft、上邻块CUAbove以及同位块CUCol的最佳预测模式标记为第一最佳模式mode(X);其中,X、Y、Z取普通Merge、Bilateral、Template、Inter2nx2n。进一步地,所述步骤8的具体过程如下:A)若i=0,判断mode(P)与mode(X)是否相同,若相同,则进入步骤8.2,若不同,进入步骤8.1;步骤8.1:将当前编码单元CU进行mode(X)的预测,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;判断是否满足左邻块CULeft、上邻块CUAbove以及同位块CUCol的失真Dj以及率失真代价RDj均大于当前编码单元CU在当前最佳预测模式mode*下的失真D以及最佳率失真代价RD*,若满足,则进入步骤9,若不满足,则进入步骤8.2;步骤8.2:判断mode(P)与mode(Y)是否相同,若相同,则进入步骤8.4,若不同,进入步骤8.3;步骤8.3:将当前编码单元CU进行mode(Y)的预测,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;判断是否满足左邻块CULeft、上邻块CUAbove以及同位块CUCol中至少两个块的失真Dj以及率失真代价RDj均大于当前编码单元CU在当前最佳预测模式mode*下的失真D以及率失真代价RD*,若满足,则进入步骤9,若不满足,则进入步骤8.4;步骤8.4:判断mode(P)与mode本文档来自技高网
...
一种基于决策树的帧间快速模式选择方法

【技术保护点】
1.一种基于决策树的帧间快速模式选择方法,其特征在于,包括以下步骤:

【技术特征摘要】
1.一种基于决策树的帧间快速模式选择方法,其特征在于,包括以下步骤:步骤1:构建当前编码单元CU最佳预测模式分类器;从国际标准测试序列中随机选取四个视频测试序列,在所选的四个测试序列的100帧的编码信息中,获取当前编码单元CU的左邻块CULeft、上邻块CUAbove以及同位块CUCol的相关信息;以CULeft、CUAbove、CUCol的最佳模式,CUCol的MV,CUCol的残差和编码QP值,当前编码单元CU的平均像素作为输入数据,以当前编码单元CU的最佳预测模式作为输出数据,选择10重交叉验证,对weka中的J48决策树进行训练,得到基于决策树的当前编码单元CU最佳预测模式分类器;步骤2:获取编码过程中当前编码单元CU的最佳预测模式预估值mode(P);提取编码过程中,当前编码单元的CULeft、CUAbove、CUCol的最佳模式,CUCol的MV,CUCol的残差和编码QP值以及当前编码单元CU的平均像素,输入至步骤1构建的构建当前编码单元CU最佳模式分类器,获取编码过程中当前编码单元CU的最佳预测模式预估值mode(P);步骤3:获取左邻块CULeft、上邻块CUAbove以及同位块CUCol的最佳预测模式modej,以及在对应最佳预测模式下的失真Dj和率失真代价RDj,若mode(P)与modej均不为AffineMerge模式,进入步骤4,否则,依次进行所有帧间模式的预测后,进入步骤9;步骤4:统计相同最佳预测模式的个数i,其中,j表示Left、Above、Col;步骤5:依据i的取值,获取当前编码单元CU的最佳预测模式候选值;步骤6:对当前编码单元CU进行AffineMerge模式的预测,并将AffineMerge模式标记为当前编码单元CU的当前最佳模式mode*,同时将AffineMerge模式下的率失真代价标记为当前最佳率失真代价RD*;步骤7:对当前编码单元CU进行mode(P)的预测,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;步骤8:基于当前编码单元CU的最佳预测模式预估值mode(P),再依次对当前编码单元CU的最佳预测模式候选值进行模式预测,在每次模式预测后,更新当前最佳预测模式mode*和当前最佳率失真代价RD*;在各种i的取值下,基于当前编码单元CU的最佳预测模式预估值mode(P),依次选择当前编码单元CU的最佳预测模式候选值进行模式预测,从而结束当前编码单元帧间模式的预测。2.根据权利要求1所述的方法,其特征在于,所述当前编码单元CU的最佳预测模式候选值的获取过程如下:1)若i=0,按照失真Dj从小到大对左邻块CULeft、上邻块CUAbove以及同位块CUCol排列,并将排列后的左邻块CULeft、上邻块CUAbove以及同位块CUCol对应的最佳预测模式依次标记为第一最佳预测模式候选值mode(X)、第二最佳预测模式mode(Y)、第三最佳预测模式mode(Z);2)若i=2,将左邻块CULeft、上邻块CUAbove以及同位块CUCol中的相同模式标记为第一最佳预测模式mode(X),不同的模式标记为第二最佳预测模式mode(Y);3)若i=3,将左邻块CULeft、上邻块CUAbove以及同位块CUCol的最佳预测模式标记为第一最佳模式mode(X);其...

【专利技术属性】
技术研发人员:张昊雷诗哲王塞博牟凡符婷
申请(专利权)人:中南大学
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1