【技术实现步骤摘要】
一种面向多场景的自适应决策树选择的帧间快速预测算法
本专利技术属于HEVC视频编码领域,具体涉及一种面向多场景HEVC编码单元间利用自适应选择决策树的帧间预测优化编码方法。
技术介绍
随着多媒体服务的多元化,如高清视频的普及,超高清分辨率(如4kx2k,8kx4k等)的出现,对编码性能的要求已经越来越超出H.264的能力范围,渐渐无法满足一些技术或者性能上的需求。为了解决上述问题,动态图像专家组(MovingPictureExpertsGroup,MPEG)和视频编码专家组(VideoCodingExpertsGroup,VCEG)成立了视频编码联合组(JointCollaborativeTeamonVideoCoding,JCT-VC)于2013年2月份正式发布了高性能视频编码标准(HighEfficiencyVideoCoding,HEVC)。HEVC编码器框架采用与H.264/AVC标准类似的预测加变换的混合编码框架,具有帧内预测、帧间运动估计、帧间运动补偿、变换、量化、环路滤波、熵编码等模块。HEVC标准采用了更为灵活有效的块划分结构,引入了编码树单元(CodingTreeUnit,CTU),编码单元(CodingUnit,CU),预测单元(PredictionUnit,PU)和变换单元(TransformUnit,TU)的概念。此外,编码树块(CodingTreeBlock,CTB),编码块(CodingBlock,CB),预测块(PredictionBlock,PB)和变换块(TransformBlock,TB)为与CTU,CU,PU和TU相对 ...
【技术保护点】
1.一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,包括以下步骤:(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD的概率情况;(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。
【技术特征摘要】
1.一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,包括以下步骤:(1)预备部分:输入一个视频测试序列,对该视频序列中CU帧间预测的各个PU模式进行概率统计,得到帧间预测各个PU模式MSM、2N×2N、N×2N、2N×N、N×N、nL×2N、nR×2N、2N×nU、2N×nD的概率情况;(2)训练部分:分若干个场景类别输入视频测试序列,针对各个场景类别的视频序列收集其CU块的相关特征,将收集到的特征进一步进行筛选和优化,再针对各个场景类别基于优化后的特征生成8×8、16×16、32×32、64×64的决策树;(3)执行部分:输入一段由各个场景所组成的视频序列,对输入视频根据视频内场景的变换进行分割,收集各个分割后视频序列CU块的相关特征并进行优化;利用优化后的特征对分割后的视频序列进行场景类别判断并选择合适的决策树,若无合适的决策树则转入训练部分更新决策树;将优化后的特征数据传入针对该场景的决策树进行判断;判断完成,确定是否继续遍历之后的PU预测模式,帧间预测结束。2.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,所述步骤(2)包括以下步骤:(2-1)选取一个标准视频测试序列输入,对帧间预测的各个模式进行概率统计;(2-2)有着不同场景类别的标准视频序列,需依次输入,先选取一个场景类别的视频输入,记录视频序列中以CU为单位MSM、2Nx2N模式的一系列相关属性;(2-3)测试(2)中MSM、2Nx2N模式的一系列相关属性与CU最佳划分模式的相关情况,筛选出相关性高的属性;由于大部分属性和视频序列自身纹理等因素相关,我们需要对属性进行优化,为了避免每个属性的特征值受视频序列本身的影响,对其进行归一化;(2-4)根据筛选优化好的特征能够对当前CU的划分模式进行预测,选取机器学习中C4.5的算法使用机器学习软件WEKA来建立决策树,针对不同场景类别建立8×8、16×16、32×32、64×64的决策树。3.根据权利要求1所述的一种面向多场景的自适应决策树选择的帧间快速预测算法,其特征在于,其中步骤(3)执行模块包括以下步骤:(3-1)输入一个由多种场景组成的视频序列;(3-2)根据场景变化,将该视频序列分割为针对各个场景的若干小视频序列;(3-3)帧间预测开始,若判断CU为8×8、16×16、32×32大小,则收集上层CU的划分模式,若判断CU为64×64大小,则跳过该步骤,最终8×8、16×16、32×32、64×64大小的CU都进入MSM以及2Nx2N模式收集率失真值、运动矢量值等数据,从而获得本发明列出的选取的特征;(3-4)针对每个分割好的小视频序列,确定该小视频序列场景最适合的决策树,如没有则转入训练部分,更新这一场景的决策树种类;(3-5)将该小视频序列的特征传入决策树进行判断;若判断结果为不划分,则跳过之后的所有预测模式,将最佳预测模式判定为MSM和2Nx2N模式中率失真值较小的模式;若判断结果为继续划分,则按照HM原始计算顺序正常进行遍历帧间预测中剩余所有模式的步骤,遍历结束后得到率失真值最小的那个模式为最佳预测模式;(3-6)输出结果,帧间预测结束。4.根据权利要求3所述的一种面向多场景的自适应决策树选择的帧间快速预测算法执行模块,其特征在于,其中步...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。