一种基于方向梯度统计特征的快速帧内预测模式决策方法技术

技术编号:28384596 阅读:29 留言:0更新日期:2021-05-08 00:13
本发明专利技术公开一种基于方向梯度统计特征的快速帧内预测模式决策方法,包括步骤:S1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数据集;S2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,x

【技术实现步骤摘要】
一种基于方向梯度统计特征的快速帧内预测模式决策方法
本专利技术属于视频压缩
,具体涉及一种基于方向梯度统计特征的快速帧内预测模式决策方法。
技术介绍
高清、超高清及4K视频等超高分辨率视频的出现,一方面,这意味着需要更大的带宽来传输视频数据,另一方面,也意味着需要更大的存储空间来保存视频数据。为缓解视频传输、存储对资源的需求,视频编码标准作为视频压缩技术的一种常用有效手段,目标是在不降低视频解码后的视频质量的条件下,最大可能地提高视频压缩比。视频编码标准发展历程中,一直都在探索创新中寻求新的突破,截止目前已经发布了很多不同的版本,最新版本是还在不断完善中的H.266/VVC(versatilevideocoding)标准。VVC预测编码包括帧内预测编码和帧间预测编码。帧内预测编码消除了大量空域冗余,它是利用同一帧已编码完成的像素点对即将编码的像素点进行预测。VVC帧内预测模式由H.265原有的35种增加到67种,即DC模式,Planar平面模式,和65种角度预测模式。预测模式的增加大大提高了帧内预测的准确性,但同时也带来了非常高的计算复杂度。VVC帧内预测通过采用粗模式选择(RMD)和最有可能预测模式(MPM)相结合的方法减少率失真优化(RDO)过程中涉及到的预测模式,从而降低帧内预测编码的复杂度。但即使是这样,VVC的帧内预测模式仍然涉及到众多的帧内模式选择,运算量非常大。
技术实现思路
为了降低帧内预测模式决策复杂度,本专利技术公布了一种基于方向梯度统计特征(SOG)的H.266/VVC快速帧内编码方法,以解决Planar和非Planar模式的快速决策。具体来说,用基于梯度方向统计的9维特征向量SOG提取每个编码块(CU)的信息,然后利用SOG特征,针对每种大小的CU,分别训练了一个支持向量机(SVM:SupportVectorMachine)模型,用于进行Planar和非Planar预测模式的快速决策。本方法可以在保证编码效果的前提下有效降低编码算法的计算复杂度。本专利技术采用以下技术方案:一种基于方向梯度统计特征的快速帧内预测模式决策方法,包括步骤:S1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数据集;S2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,xQstep}和对应的类别标签y,计算局部区域的梯度方向并进行统计,以此作为该局部区域的特征,并将训练数据集划分成训练集、验证集、测试集,其中特征SOG反映了编码块CU的方向特征,xQStep表示量化步长;S3、在离线阶段,训练各不同大小编码块CU的SVM离线模型;S4、在在线阶段,提取当前待编码块CU的特征向量,并将其输入到步骤S3训练好的对应的SVM模型中,并通过SVM模型预测待编码块CU是否选择Planar模式。作为优选方案,步骤S1中,N个类型分别是A、B、C、D、E,5个类型,且该5个类型的视频序列为根据分辨率的不同进行分类,其中A类视频分辨率是2560×1600,B类视频分辨率是1920×1080,C类视频分辨率是832×480,D类视频分辨率是416×240,E类视频分辨率是1280×720。作为优选方案,5个类型的视频序列分别选择A类视频序列Peopleonstreet、B类视频序列BQterrace、C类视频序列BQmall、D类视频序列Basketballpass、E类视频序列Fourpeople。作为优选方案,步骤S1中,A类视频序列帧数为13帧、B类视频序列帧数为25帧、C类视频序列帧数为125帧、D类视频序列帧数为500帧、E类视频序列帧数为55帧。作为优选方案,步骤S1中,通过在每个类型的视频序列中分别随机抽取相同数量的训练实例并对所述训练实例进行标签分类,以组成所需的训练数据集,且标签y=1表示当前编码块CU判断为选择Planar模式的类,标签y=-1表示当前编码块CU判断为没有选择Planar模式的类。作为优选方案,步骤S2中,具体包括如下步骤:S2.1、使用[-1,0,1]算子计算每个像素点x轴梯度值,使用[-1,0,1]T算子计算每个像素点y轴梯度值,即编码块CU中像素点(x,y)的梯度为:Gx(x,y)=H(x+1,y)-H(x-1,y)Gy(x,y)=H(x,y+1)-H(x,y-1),公式中Gx(x,y)表示目标区域位置(x,y)的水平方向梯度,Gy(x,y)表示目标区域位置(x,y)的垂直方向梯度,H(x,y)表示位置(x,y)的像素值;S2.2、通过Gx(x,y)和Gy(x,y)计算该像素点的梯度大小G(x,y)和梯度方向Θ(x,y),即:公式中G(x,y)为梯度大小,Θ(x,y)为梯度方向;S2.3、根据当前编码块CU中每个位置的梯度大小及方向进行SOG特征计算;S2.4、计算量化步长xQStep,以反映量化参数QP,并将xQStep加入特征向量X,计算量化步长xQStep的公式如下:其中QP取22、27、32、37中的一个数值;S2.5、将帧内预测Planar和非Planar模式决策的过程转化为二分类问题,即可以表示为y={+1,-1};S2.6、将训练数据集划分成训练集、验证集、测试集。作为优选方案,步骤S2.3中,具体包括以下步骤:S2.3.1、以20°为间隔将梯度方向进行量化,得到9个方向区间,其角度中心数值分别为10°、30°、50°、70°、90°、110°、130°、150°、170°;S2.3.2、初始化SOG特征为9维0矢量,SOG=[Sog1、Sog2、Sog3、Sog4、Sog5、Sog6、Sog7、Sog8、Sog9]=[0,0,0,0,0,0,0,0,0];S2.3.3、按像素点逐点计算当前编码块CU的SOG特征,假设当前像素点的梯度大小和方向分别G(x,y)、Θ(x,y),以下分别用G、Θ表示,计算方法如下:A.根据Θ找出离其最近的两个角度中心Θi、Θi+1;B.按Θ离两个角度中心Θi和Θi+1的距离得到两个加权系数(Θ-Θi)/20和(Θi+1-Θ)/20;C.按下面公式计算该点的SOG特征:Sogi=Sogi+G×(Θi+1-Θ)/20,Sogi+1=Sogi+1+G×(Θ-Θi)/20,若Θ与某个方向区间i的角度中心重合,则该点只对应方向区间i,此时SOG特征计算公式为:Sogi=Sogi+G。作为优选方案,步骤S3中,训练各不同大小编码块CU的SVM离线模型,共17个模型。作为优选方案,步骤S3中,SVM离线模型选用径向基函数为核函数,惩罚参数C和RBF参数γ由网格搜索GS法确定。作为优选方案,步骤S4中,具体包括以下步骤:S4.1、提取当前待编码块CU的特征向量X,根据当前块大小选择对应大小的SVM模型进行分类判别;S4.2、若SVM模型预测该本文档来自技高网...

【技术保护点】
1.一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,包括步骤:/nS1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数据集;/nS2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,x

【技术特征摘要】
1.一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,包括步骤:
S1、在离线阶段,从N个类型的视频序列中提取训练实例,以组成训练数据集;
S2、在离线阶段,利用训练数据集提取编码块CU的特征向量X={SOG,xQstep}和对应的类别标签y,计算局部区域的梯度方向并进行统计,以此作为该局部区域的特征,并将训练数据集划分成训练集、验证集、测试集,其中特征SOG反映了编码块CU的方向特征,xQStep表示量化步长;
S3、在离线阶段,训练各不同大小编码块CU的SVM离线模型;
S4、在在线阶段,提取当前待编码块CU的特征向量,并将其输入到步骤S3训练好的对应的SVM模型中,并通过SVM模型预测待编码块CU是否选择Planar模式。


2.根据权利要求1所述的一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,步骤S1中,N个类型分别是A、B、C、D、E,5个类型,且该5个类型的视频序列为根据分辨率的不同进行分类,其中A类视频分辨率是2560×1600,B类视频分辨率是1920×1080,C类视频分辨率是832×480,D类视频分辨率是416×240,E类视频分辨率是1280×720。


3.根据权利要求2所述的一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,5个类型的视频序列分别选择A类视频序列Peopleonstreet、B类视频序列BQterrace、C类视频序列BQmall、D类视频序列Basketballpass、E类视频序列Fourpeople。


4.根据权利要求1所述的一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,步骤S1中,A类视频序列帧数为13帧、B类视频序列帧数为25帧、C类视频序列帧数为125帧、D类视频序列帧数为500帧、E类视频序列帧数为55帧。


5.根据权利要求1所述的一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,步骤S1中,通过在每个类型的视频序列中分别随机抽取相同数量的训练实例并对所述训练实例进行标签分类,以组成所需的训练数据集,且标签y=1表示当前编码块CU判断为选择Planar模式的类,标签y=-1表示当前编码块CU判断为没有选择Planar模式的类。


6.根据权利要求5所述的一种基于方向梯度统计特征的快速帧内预测模式决策方法,其特征在于,步骤S2中,具体包括如下步骤:
S2.1、使用[-1,0,1]算子计算每个像素点x轴梯度值,使用[-1,0,1]T算子计算每个像素点y轴梯度值,即编码块CU中像素点(x,y)的梯度为:
Gx(x,y)=H(x+1,y)-H(x-1,y)
Gy(x,y)=H(x,y+1)-H(x,y-1),
公式中Gx(x,y)表示目标区域位置(x,y)的水平方向梯度,Gy(x,y)表示目标区域位置(x,y)的垂直方向梯度,H(x,y)表示位置(x,y)的像素值;
S2.2、通过Gx(x,y)和...

【专利技术属性】
技术研发人员:王娇娇姚英彪杜晨杰徐欣冯维许晓荣
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1