一种基于决策树的HEVC屏幕内容帧内快速编码算法制造技术

技术编号:19830136 阅读:21 留言:0更新日期:2018-12-19 17:17
本发明专利技术提出一种基于决策树的HEVC屏幕内容帧内快速编码算法,属于视频编解码技术领域。该算法包括:1)提取有效的特征值;2)生成原始数据集作为训练集,在此基础上加以训练完成决策树,包括CU决策树和PU决策树;3)将图像分割为若干个CTU,在执行帧内编码过程中,判断当前CU是否为边界CTU,如果是则执行标准算法完成编码,否则进行步骤4);4)执行快速编码,即在一定深度的决策树中,通过对该层的特征值的计算完成当前CU的划分与PU模式的选择。本发明专利技术通过决策树做判决的算法通过减少CU深度和PU的模式遍历而降低编码复杂度。最终保证在码率和峰值信噪比基本不变的情况下,有效减少编码时间,达到快速帧内编码的效果。

【技术实现步骤摘要】
一种基于决策树的HEVC屏幕内容帧内快速编码算法
本专利技术涉及视频编解码
,特别是涉及一种基于决策树的HEVC屏幕内容帧内快速编码算法。
技术介绍
近几年,随着互联网和移动端智能设备的快速发展,多媒体视频应用产生的视频数据约占人类通讯数据量的80%。思科Cisco预期至2019年,移动视频数据将占设备数据通信总量的72%以上。尽管近年来网络带宽和存储能力增加迅速,但是也远不能满足人们对于存储和传输高分辨率视频的要求。面对如此大量的数据和即时视频通信的严格要求,高效快速的视频编码技术的改善显得尤为重要。视频快速编码算法是编码视频的重要技术手段,是视频稳定传输和高效存储的重要保障。就目前来讲,随着云计算、远程桌面和无线显示技术的发展,如何在低码率的情况下使屏幕图像在电脑屏幕、手机屏幕、电视机屏幕和其它客户端上高质量地显示,吸引了学术界和工业界的广泛关注。视频快速编码算法的研究成为了现今视频编码的一个研究热点,基于HEVC(HighEfficiencyVideoCoding,一种新的视频压缩标准)的屏幕内容编码(ScreenContentCoding,SCC)快速算法的研究也得到了进一步的重视和发展。另外,产业界数据量的爆炸式增长促进了机器学习的发展。通过机器学习对数据进行深入归纳、分析,从而获取新的、规律性的信息和知识来辅助决策的方法越来越受到学术界和产业界的关注。现今,基于四叉树结构的视频编码算法在编码过程中存在大量的计算冗余。在算法优化过程中,减少这种计算冗余将可以有效节约编码时间。同机器学习中的一些分类算法相比较,视频编码中的一些CU(编码单元)块划分以及PU(预测单元)模式选择的过程与机器学习中的分类思想十分相似。有效的利用机器学习算法进行视频编解码将有助于视频编码技术的发展。为有效的降低HEVCSCC帧内编码复杂度,减少编码时间,人们已经进行了大量的研究工作。文献《HashbasedfastlocalsearchforIntraBlockCopy(IntraBC)modeinHEVCscreencontentcoding》中提出了基于哈希块匹配的快速搜索算法以降低编码复杂度。文献《FastHEVCscreencontentcodingbyskippingunnecessarycheckingofintrablockcopymodebasedonCUactivityandgradient》利用梯度的自适应双阈值设置的方法跳过不必要的PU模式检测减少编码时间。在文献《ContentbasedmodeanddepthskippingwithSharpandDirectionalEdgesforintrapredictioninScreenContentCoding》中,通过判断是否具有水平垂直的边缘检测的方法来判定,减少PU候选模式检测数。这些传统的快速算法虽然能够有效的减少编码时间,但大部分都具有局限性,不能针对所有的视频类型都能做到很好的复杂度降低,且许多阈值的设定都利用经验性的实验结果来确定。本次提出的快速算法使用机器学习的决策树模型,方便简单,且能有效挖掘视频特征信息,无差别的分析视频特性,有效的降低编码复杂度。
技术实现思路
HEVCSCC继承了HEVC的编码框架,CU划分仍然采用了四叉树结构。HEVCSCC帧内编码过程的复杂度主要集中在CU划分和PU模式选择的遍历过程。在标准算法编码过程中,使用遍历选择最小的率失真代价的方式进行最优模式选取。另外,就IBC模式的哈希搜索过程,其匹配块的搜索过程占据了较大的时间,虽然匹配块搜索方式比较简单,但是寻找匹配块的过程比较次数较多,增加了编码复杂度。一种基于决策树的HEVC屏幕内容帧内快速编码算法,包括以下步骤:1)对标准视频序列进行特性分析,提取有效的特征值;2)通过标准测试序列的视频帧的选择,生成原始数据集作为训练集,在此基础上加以训练完成决策树,包括CU决策树和PU决策树;3)读取图像,并将图像分割为若干个CTU,在执行帧内编码过程中,判断当前CU是否为边界CTU,如果是则执行标准算法完成编码,否则进行步骤4);4)执行快速编码,即在一定深度的决策树中,通过对该层的特征值的计算完成当前CU的划分与PU模式的选择。进一步的,特征值包括CU像素值的方差CUD、平均非零梯度AveGDN、CU信息熵ent以及像素种类数CNum,其中CU信息熵包括梯度信息熵GDen和像素信息熵Pixen。进一步的,在CU决策树中主要用到的特征值有:CU像素值的方差CUD、梯度信息熵GDen和像素种类数CNum;对当前层CU的决策表现为划分或不划分,对应的在算法流程中表现为跳过或终止。进一步的,所述CU决策树深度为0、1和2;在深度为0时,计算CUD,若CUD>α01,则执行快速划分,且深度加1;若CUD≤β01,若是则执行快速终止,调用当前层对应的PU决策树,β01<α01;在深度为1时,计算CUD、GDen和CNum,若CNum≤β11且GDen≤β12,执行快速终止,并调用当前层对应的PU决策树;若CNum>α11且CUN>α12,执行快速划分,且深度加1,β11<α11;在深度为2时,计算CUD和CNum,若CNum≤β21且CUN<β22,执行快速终止,并调用当前层对应的PU决策树;其余不满足上述3层CU决策树特征值判断条件的情况,按照标准算法遍历深度,即在当前层调用PU决策树,且进行深度加1。进一步的,CU划分中,初始标志位设置有split_Flag=0和end_Flag=0;CU决策树中,最终的决策结果有三种标志位状态:1)split_Flag=0且end_Flag=0,代表执行PU决策树的调用,且深度加1;2)split_Flag=0且end_Flag=1,代表执行PU决策树的调用,并进行快速终止;3)split_Flag=1且end_Flag=0,代表执行快速划分,且深度加1,不执行PU决策树的调用。进一步的,在PU决策树中主要使用的特征值包括像素种类数CNum、平均非零梯度AveGDN、像素信息熵Pixen和梯度信息熵GDen,对当前层PU的决策表现为自然图像块NB和屏幕内容块SB。进一步的,所述PU决策树深度为0、1、2和3;在深度为0时,计算CNum,若CNum>γ01,PU执行NB对应的35种模式检测;在深度为1时,计算AveGDN和Pixen,若AveGDN≤λ11且Pixen>γ12,执行NB对应的35种模式检测;若AveGDN>λ11,执行SB对应的IBC和PLT模式的决策;深度为2时,计算AveGDN和Pixen,若AveGDN>λ21且Pixen≤λ22,执行SB对应的IBC和PLT模式的决策;若AveGDN≤λ21且Pixen>γ22,执行NB对应的35种模式检测;在深度为3时,计算AveGDN和GDen,若AveGDN≤γ31,执行NB对应的35种模式检测;若AveGDN>λ31且GDen>λ32,执行SB对应的IBC和PLT模式的决策,λ31>γ31;其余不满足4层PU决策树特征值判断条件的情况,按照所有可能模式进行模式遍历。进一步的,PU模式决策中,初始标志位包括NB_Flag=0和SB_Flag=0;在PU决策树本文档来自技高网
...

【技术保护点】
1.一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于:包括以下步骤:1)对标准视频序列进行特性分析,提取有效的特征值;2)通过标准测试序列的视频帧的选择,生成原始数据集作为训练集,在此基础上加以训练完成决策树,包括CU决策树和PU决策树;3)读取图像,并将图像分割为若干个CTU,在执行帧内编码过程中,判断当前CU是否为边界CTU,如果是则执行标准算法完成编码,否则进行步骤4);4)执行快速编码,即在一定深度的决策树中,通过对该层的特征值的计算完成当前CU的划分与PU模式的选择。

【技术特征摘要】
1.一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于:包括以下步骤:1)对标准视频序列进行特性分析,提取有效的特征值;2)通过标准测试序列的视频帧的选择,生成原始数据集作为训练集,在此基础上加以训练完成决策树,包括CU决策树和PU决策树;3)读取图像,并将图像分割为若干个CTU,在执行帧内编码过程中,判断当前CU是否为边界CTU,如果是则执行标准算法完成编码,否则进行步骤4);4)执行快速编码,即在一定深度的决策树中,通过对该层的特征值的计算完成当前CU的划分与PU模式的选择。2.根据权利要求1所述的一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于:特征值包括CU像素值的方差CUD、平均非零梯度AveGDN、CU信息熵ent以及像素种类数CNum,其中CU信息熵包括梯度信息熵GDen和像素信息熵Pixen。3.根据权利要求2所述的一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于,在CU决策树中用到的特征值包括:CU像素值的方差CUD、梯度信息熵GDen和像素种类数CNum;对当前层CU的决策表现为划分或不划分,对应的在算法流程中表现为跳过或终止。4.根据权利要求3所述的一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于:所述CU决策树深度为0、1和2;在深度为0时,计算CUD,若CUD>α01,则执行快速划分,且深度加1;若CUD≤β01,若是则执行快速终止,调用当前层对应的PU决策树,β01<α01;在深度为1时,计算CUD、GDen和CNum,若CNum≤β11且GDen≤β12,执行快速终止,并调用当前层对应的PU决策树;若CNum>α11且CUN>α12,执行快速划分,且深度加1,β11<α11;在深度为2时,计算CUD和CNum,若CNum≤β21且CUN<β22,执行快速终止,并调用当前层对应的PU决策树;其余不满足上述3层CU决策树特征值判断条件的情况,按照标准算法遍历深度,即在当前层调用PU决策树,且进行深度加1。5.根据权利要求4所述的一种基于决策树的HEVC屏幕内容帧内快速编码算法,其特征在于:CU划分中,初始标志位设置有split_Flag=0和end_Flag=0;CU决策树中,最终的决策结果有三种标志位状态:1...

【专利技术属性】
技术研发人员:黄胜司朋涛肖傲李萌芳袁建国
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:重庆,50

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1