当前位置: 首页 > 专利查询>南京大学专利>正文

一种面向多场景的自适应决策树选择的帧间快速预测算法制造技术

技术编号:20395419 阅读:18 留言:0更新日期:2019-02-20 05:11
一种面向多场景的自适应决策树选择的帧间快速预测算法,包括以下步骤:1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式的概率情况;2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;确定是否继续遍历之后的PU预测模式,帧间预测结束。

【技术实现步骤摘要】
一种面向多场景的自适应决策树选择的帧间快速预测算法
本专利技术属于HEVC视频编码领域,具体涉及一种面向多场景HEVC编码单元间利用自适应选择决策树的帧间预测优化编码方法。
技术介绍
随着多媒体服务的多元化,如高清视频的普及,超高清分辨率(如4kx2k,8kx4k等)的出现,对编码性能的要求已经越来越超出H.264的能力范围,渐渐无法满足一些技术或者性能上的需求。为了解决上述问题,动态图像专家组(MovingPictureExpertsGroup,MPEG)和视频编码专家组(VideoCodingExpertsGroup,VCEG)成立了视频编码联合组(JointCollaborativeTeamonVideoCoding,JCT-VC)于2013年2月份正式发布了高性能视频编码标准(HighEfficiencyVideoCoding,HEVC)。HEVC编码器框架采用与H.264/AVC标准类似的预测加变换的混合编码框架,具有帧内预测、帧间运动估计、帧间运动补偿、变换、量化、环路滤波、熵编码等模块。HEVC标准采用了更为灵活有效的块划分结构,引入了编码树单元(CodingTreeUnit,CTU),编码单元(CodingUnit,CU),预测单元(PredictionUnit,PU)和变换单元(TransformUnit,TU)的概念。此外,编码树块(CodingTreeBlock,CTB),编码块(CodingBlock,CB),预测块(PredictionBlock,PB)和变换块(TransformBlock,TB)为与CTU,CU,PU和TU相对应的存储颜色分量的二维矩阵。即一个CTU包含了一个亮度的CTB以及两个色度的CTB。CU,PU和TU也有类似的关系。一个典型的编码过程如下所述:对于输入编码器的每一帧图像,将被分割成为若干个块状的CTU,一个CTU会被分成若干个CU,以此来适应本地不同的内容特性。我们可以将CU、CTU他们两者之间的关系用四叉树来表示,CTU是这棵四叉树的根节点,四叉树结构也称为编码树,被用来将CTU划分成多个CU。假设CTU的大小为2N×2N,其中N的取值可以为8,16或32,则一个CTU可以单独作为一个CU,或者分成4个大小为N×N的单元,它们都是四叉树的结点。帧间模式可以使用八种划分模式,包括两种正方形形状(PART_2N×2N,PART_N×N),两种长方形形状(PART_2N×N,PART_N×2N),四种非对称形状(PART_2N×nU,PART_2N×nD,PART_nL×2N,PART_nR×2N)。帧间图像的模式判决与率失真代价RDcost有关,模式选择会遍历并计算所有模式的RDcost,最后选取使得RDcost最小的模式为最终模式,这导致极大程度复杂度的上升。因为即使最佳PU预测模式在最前面的几个模式之中,编码器还得继续测完剩余全部的PU预测模式,这就增加了一些不必要的计算。由于帧间模式判断占用了大量的时间,我们需要选择合适的快速模式选择方法来降低编码的计算复杂度。在CN105791826A李康等人所写的专利中是通过决策树的算法来对帧间预测的模式选择进行判断,而本专利技术采用自适应选择决策树的方法对帧间预测进行优化,针对多个场景混合的视频序列可以自适应地根据各个场景选用合适的决策树。
技术实现思路
本专利技术的目的在于,提供一种针对不同类别视频场景的HEVC帧间预测快速算法,实现了自适应地根据视频序列场景去选择最佳决策树,在保证编码率失真基本没有损失的同时,针对视频序列中各个场景自适应地降低HEVC的计算复杂度。本专利技术的技术方案是:基于场景类别自适应选择决策树的帧间预测快速算法,根据视频序列场景类别自适应地选择最佳决策树来降低HEVC的编码复杂度,本快速算法基于预备、训练和执行三个模块:预备模块:输入一个视频序列,统计该视频序列帧间预测过程中CU块的各个PU预测模式的概率,得到概率统计情况;训练模块:分场景类别输入视频序列,针对各个场景类别视频序列收集其CU块的相关特征,将收集到的特征根据PU预测模式划分情况的相关性进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;执行模块:将由各个场景组成的视频序列输入,对输入视频序列进行场景分割,收集分割之后的视频序列的特征并优化,使用收集后的特征数据判断场景类别并选择该场景类别所对应的决策树,将统计完的特征传入决策树进行判决,输出最终划分结果;包括以下步骤:(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式(MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD)的概率情况;(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束;所述步骤(2)包括以下步骤:(2-1)选取一个标准视频测试序列输入,对帧间预测的各个模式进行概率统计;(2-2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;(2-3)测试(2)中MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况,筛选出相关性高的属性;由于大部分属性和视频序列自身纹理等因素相关,需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,对其进行归一化;(2-4)根据筛选优化好的特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法使用机器学习软件WEKA来建立决策树,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树;其中步骤(3)执行模块包括以下步骤:(3-1)输入一个由多种场景组成的视频序列;(3-2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列;(3-3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本专利技术列出的选取的特征;(3-4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类;(3-5)将该小视频序列的特征传入决策树进行判断;若判断结果为不划分,则跳过之后的所有预测模式,将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式;若判本文档来自技高网
...

【技术保护点】
1.一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,包括以下步骤:(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD的概率情况;(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。

【技术特征摘要】
1.一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,包括以下步骤:(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD的概率情况;(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。2.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,所述步骤(2)包括以下步骤:(2-1)选取一个标准视频测试序列输入,对帧间预测的各个模式进行概率统计;(2-2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;(2-3)测试(2)中MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况,筛选出相关性高的属性;由于大部分属性和视频序列自身纹理等因素相关,我们需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,对其进行归一化;(2-4)根据筛选优化好的特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法使用机器学习软件WEKA来建立决策树,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树。3.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,其中步骤(3)执行模块包括以下步骤:(3-1)输入一个由多种场景组成的视频序列;(3-2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列;(3-3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本发明列出的选取的特征;(3-4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类;(3-5)将该小视频序列的特征传入决策树进行判断;若判断结果为不划分,则跳过之后的所有预测模式,将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式;若判断结果为继续划分,则按照HM原始计算顺序正常进行遍历帧间预测中剩余所有模式的步骤,遍历结束后得到率失真值最小的那个模式为最佳预测模式;(3-6)输出结果,帧间预测结束。4.根据权利要求3所述的一种面向多场景的自适应决策树选择的帧间快速预测算法执行模块,其特征在于,其中步...

【专利技术属性】
技术研发人员:王健施腾芮朱鹏
申请(专利权)人:南京大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1