一种低复杂度视频信号编码处理方法技术

技术编号:21146332 阅读:33 留言:0更新日期:2019-05-18 06:46
本发明专利技术公开了一种低复杂度视频信号编码处理方法,包括:步骤S1,获取编码CU;步骤S2,判断当前位置LID是否大于20,若是,则执行步骤S5;若否,则提取当前编码CUt的特征向量xt,之后执行步骤S3;步骤S3,利用决策器ActNN判断编码CUt的划分决策;步骤S4,定义u(t)的阈值Ф,若u(t)≥Ф,则当前编码CUt的划分决策为“停止划分”,并提前终止当前编码CUt的率失真代价RD cost比较过程,令LID加1后执行步骤S2;若u(t)<Ф,则当前编码CUt的划分决策为“继续划分”,将进行率失真代价RD cost比较的编码CUt深度增加1,依次执行步骤S2;步骤S5,划分结束。本发明专利技术能有效降低编码复杂度,进而提高编码速度。

【技术实现步骤摘要】
一种低复杂度视频信号编码处理方法
本专利技术涉及视频信号处理方法,尤其涉及一种低复杂度视频信号编码处理方法。
技术介绍
高效视频编码(HighEfficiencyVideoCoding,HEVC)是由视频编码联合合作组(JointCollaborativeTeamonVideoCoding,JCT-VC)开发的标准。HEVC相比于H.264/AVC在维持相同视频质量情况下减少了50%的码率。HEVC支持从分辨率是3840×2160或者4096×2160的4K超高分辨率(UltraHighDefinition,UHD)到分辨率是8192×4320的8KUHD。然而,HEVC的部署复杂度限制了它在实时应用场景中的广泛应用,例如在线视频广播,实时视频聊天,以及具有有限电量和计算资源的移动平台,例如智能手机、无人机等。在学术界和工业界,在可接受编码性能损失情况下减少编码复杂度得到广泛注意。与H.264/AVC相比,递归编码树单元(CodingTreeUnit,CTU)划分技术是提高HEVC编码效率的关键。视频序列的每一帧被划分为不同大小的块,即编码单元(CodingUnits,CU)。四叉树作为划分结构提高了CU划分灵活性。然而,基于率失真优化(RateDistortionOptimization,RDO)强力搜索四叉树得到最佳CU组合具有较高计算复杂度。因此,为了在保证压缩质量的情况下减少编码参数决策的率失真代价(RateDistortioncost,RDcost)比较,提出了CU决策快速算法,包括CU,预测单元(PredictionUnits,PU),变换单元(TransformUnits,TU)预测等。其中,CU决策早起终止是一种简单高效的CU决策算法。目前,CU决策算专注于将递归RDcost比较过程逐个深度的分解并控制。通过分别优化不同深度编码器性能优化整体CU决策性能。基于机器学习的CU决策方法通过采用不同机器学习方法将用到的机器学习方法包括支持向量机(SupportVectorMachine,SVM)、贝叶斯理论、马尔科夫模型、决策树、和神经网络。比如:由多个SVM二分类器组成的三输出联合分类器;将递归CU决策建模为二值SVM分类器,PU模式选择建模为多分类SVM;包含两种块测试顺序的方法,以及常规CU访问顺序和反向CU访问顺序。朴素贝叶斯算法用于实现反向CU决策优化。基于CU决策预测的二分类形式,现有技术有贝叶斯决策的CU决策策略。基于贝叶斯决策规则,现有技术有利用在线和离线学习避免没有必要的RDcost比较。此外,马尔科夫随机场被用于把特征和相邻信息合并,从而减少帧间编码CU决策复杂度。现有技术利用一阶高斯马尔科夫模型理论分析了平滑副本预测中的滤波器的最优权重。现有技术还提出通过决策树构建实现早起终止递归的RDcost比较,从而减少CU决策复杂度。针对HEVC中的屏幕内容帧内编码扩展,现有技术基于设计了基于选定特征的决策树分类器,从而区分不同类型块。考虑预测准确性,编码内存消耗和模型简化,面向屏幕内容压缩,现有技术将快速CU决策预测建模为两层神经网络分类器。以及利用卷积神经网络(ConvolutionNeuralNetwork,CNN)使用拓扑信息进行CU决策。为了利用深度结构减少HEVC的编码复杂度,现有技术利用一遍卷积计算得到一种层次CU决策图,从而预测CTU划分模式。实际应用过程中,强化学习(ReinforcementLearning,RL)和深度强化学习(DeepReinforcementLearning)已经被应用于视频编码控制和优化,现有技术已经提出为树上每一节点学习一个二分类器。目前,基于RL的二分类器专注于独立优化不同深度的CU决策。在视频编码控制方面,CU决策被建模为状态-动作对,然而,不同深度CU预测联合准确性不能够完全表达跨深度CU整体预测准确性。
技术实现思路
本专利技术要解决的技术问题在于,针对现有技术的不足,提供一种在保证高压缩比的情况下,有效降低HEVC编码复杂度,进而提高编码速度的低复杂度视频信号编码处理方法。为解决上述技术问题,本专利技术采用如下技术方案。一种低复杂度视频信号编码处理方法,其包括有如下步骤:步骤S1,获取编码CUt,其中,t表示编码单元CU在递归编码树单元CTU四叉树上的位置LID;步骤S2,判断当前位置LID是否大于20,若是,则执行步骤S5;若否,则提取当前编码CUt的特征向量xt,之后执行步骤S3;步骤S3,利用CU决策器ActNN判断编码CUt的划分决策,所述CU决策器ActNN的输出为u(t),该u(t)用于判断是否划分当前编码CUt;步骤S4,定义u(t)的阈值Ф,判断u(t)是否大于该阈值Ф,若u(t)≥Ф,则当前编码CUt的划分决策为“停止划分(unsplit)”,并提前终止当前编码CUt的率失真代价RDcost比较过程,令LID=LID+1,之后执行步骤S2;若u(t)<Ф,则当前编码CUt的划分决策为“继续划分(split)”,将进行率失真代价RDcost比较的编码CUt深度增加1,令LID依次为4×LID+1、4×LID+2、4×LID+3和4×LID+4,依次执行步骤S2;步骤S5,当前递归编码树单元CTU的编码单元CU划分结束。优选地,所述步骤S2中,所述特征向量xt表示深度特征或手动提取特征。优选地,所述特征向量xt为手动提取特征。优选地,所述特征向量xt包括当前编码CUt左侧和上方相邻编码单元CU的平均深度、当前编码CUt左侧和上方相邻编码单元CU的率失真代价RDcost、SKIP模式标志位、检测SKIP模式后的全部失真以及当前编码单元CU索引位LID。优选地,所述步骤S3中,所述CU决策器ActNN基于单隐层神经网络实现。优选地,所述步骤S3中,所述CU决策器ActNN的训练过程包括:步骤S30,构建CU决策MDP模型,所述CU决策MDP模型中的状态st表示为特征向量xt,动作at表示为划分决策中的“停止划分”或“继续划分”,奖赏rt表示为当前编码CUt的划分决策评价;步骤S31,利用所述CU决策MDP模型提取CU决策轨迹样本(st,at,rt);步骤S32,从所述CU决策轨迹样本(st,at,rt)中学习得到CU决策器ActNN。优选地,所述步骤S32中,采用端到端动作-评价(Actor-Critic)强化学习算法训练得到CU决策器ActNN。优选地,所述动作-评价(Actor-Critic)强化学习算法包括基于单隐层神经网络实现的评价网络CrtNN。优选地,所述步骤S4中,所述CU决策器ActNN的输出u(t)的阈值Ф设置为实数0。本专利技术公开的低复杂度视频信号编码处理方法,其联合不同深度编码单元CU划分过程中的CU划分策略优化,考虑RDO过程,构建有效CU划分策略以及早期终止策略,提前选择最佳CU划分大小并终止视频编码中复杂的模式选择过程,从而在保证高压缩比的前提下,即码率增加不大于3%的情况下尖峰信噪比下降小于0.1dB,降低了多视点视频编码复杂度,相比于原频编码平台,本专利技术可提高编码速度34.34%至43.33%。此外,本专利技术主要针对HEVC中CU划分的早期终止方法,可与现有技术中的其他模式选择方法相结合,本文档来自技高网
...

【技术保护点】
1.一种低复杂度视频信号编码处理方法,其特征在于,包括有如下步骤:步骤S1,获取编码CUt,其中,t表示编码单元CU在递归编码树单元CTU四叉树上的位置LID;步骤S2,判断当前位置LID是否大于20,若是,则执行步骤S5;若否,则提取当前编码CUt的特征向量xt,之后执行步骤S3;步骤S3,利用CU决策器ActNN判断编码CUt的划分决策,所述CU决策器ActNN的输出为u(t),该u(t)用于判断是否划分当前编码CUt;步骤S4,定义u(t)的阈值Ф,判断u(t)是否大于该阈值Ф,若u(t)≥Ф,则当前编码CUt的划分决策为“停止划分”,并提前终止当前编码CUt的率失真代价RD cost比较过程,令LID=LID+1,之后执行步骤S2;若u(t)<Ф,则当前编码CUt的划分决策为“继续划分”,将进行率失真代价RD cost比较的编码CUt深度增加1,令LID依次为4×LID+1、4×LID+2、4×LID+3和4×LID+4,依次执行步骤S2;步骤S5,当前递归编码树单元CTU的编码单元CU划分结束。

【技术特征摘要】
1.一种低复杂度视频信号编码处理方法,其特征在于,包括有如下步骤:步骤S1,获取编码CUt,其中,t表示编码单元CU在递归编码树单元CTU四叉树上的位置LID;步骤S2,判断当前位置LID是否大于20,若是,则执行步骤S5;若否,则提取当前编码CUt的特征向量xt,之后执行步骤S3;步骤S3,利用CU决策器ActNN判断编码CUt的划分决策,所述CU决策器ActNN的输出为u(t),该u(t)用于判断是否划分当前编码CUt;步骤S4,定义u(t)的阈值Ф,判断u(t)是否大于该阈值Ф,若u(t)≥Ф,则当前编码CUt的划分决策为“停止划分”,并提前终止当前编码CUt的率失真代价RDcost比较过程,令LID=LID+1,之后执行步骤S2;若u(t)<Ф,则当前编码CUt的划分决策为“继续划分”,将进行率失真代价RDcost比较的编码CUt深度增加1,令LID依次为4×LID+1、4×LID+2、4×LID+3和4×LID+4,依次执行步骤S2;步骤S5,当前递归编码树单元CTU的编码单元CU划分结束。2.如权利要求1所述的低复杂度视频信号编码处理方法,其特征在于,所述步骤S2中,所述特征向量xt表示深度特征或手动提取特征。3.如权利要求2所述的低复杂度视频信号编码处理方法,其特征在于,所述特征向量xt为手动提取特征。4.如权利要求3所述的低复杂度视频信号编码处理方法,其特征在于,所述特征向量xt包括当前编码CUt左侧和上方相邻编码单元CU的平均深度、当前编码CUt左侧和上方相邻编码单元CU的率失真代价RDcost、SKIP模式标志位、检测SKIP模式后的全部失真以及当前编码单元CU索引位LID。5.如权利要求1所述的低复杂度视频信号编码处理方法,其特征在于,所述步骤S3中,所述CU决策器ActNN基于单隐层神经网络实现。6.如权利要求5所述的低复杂度视频信号编码处理方法,其特征在于,所述步骤S3中,所述CU决策器ActNN的训练过程包括:步骤S30,构建CU决策MDP模型,所述CU决策MDP模型中的状态st表示为特征向量xt,动作at表示为划分决策中的“停止划分”或“...

【专利技术属性】
技术研发人员:李娜张云
申请(专利权)人:中国科学院深圳先进技术研究院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1