一种基于内容自适应的帧内图像编码单元划分方法与系统技术方案

技术编号:33700522 阅读:30 留言:0更新日期:2022-06-06 08:08
本发明专利技术公开了一种基于内容自适应的帧内图像编码单元划分方法与系统,涉及图像处理技术领域,包括步骤:获取各训练样本在率失真优化编码下的编码单元划分结果;提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;基于特征向量集和相应划分结果进行第一加权SVM分类器的训练;基于训练结果依次通过第一和第三加权SVM分类器进行预测样本的划分判断;根据预测样本在各编码深度下的划分结果进行帧内图像的划分。本发明专利技术通过获取帧内图像中各编码单元的划分决策,减少非必要编码深度下的划分计算,进而提高编码效率。进而提高编码效率。进而提高编码效率。

【技术实现步骤摘要】
一种基于内容自适应的帧内图像编码单元划分方法与系统


[0001]本专利技术涉及图像处理
,具体涉及一种基于内容自适应的帧内图像编码单元划分方法与系统。

技术介绍

[0002]联合视频编码组(Joint collaborative team on video coding,JCT

VC)在2013年发布了一种高效视频压缩标准H.265/HEVC。H.265/HEVC标准成功之处在于采用了基于块的混合视频编码框架。H.265/HEVC相较于H.264/AVC实现了一半的比特节省,它的最大编码单元(CU)尺寸为64
×
64。在HEVC的混合编码结构中集成了很多新的编码工具。特别地,H.265/HEVC引入了树形结构单元(CTU),每一个CTU按四叉树分割方式划分为不同类型的编码单元。在帧内预测技术中,原来的H.264/AVC支持最多9种预测模式,而H.265/HEVC支持多达35种的预测模式。帧间预测方面,H.265/HEVC则是采用了AMVP技术,它可以预测更加准确的运动矢量。和H.264/AVC不同,H.265/HEVC的熵编码只采用CABAC 技术。然而,基于速率失真(RD)优化的方法大大增加了HEVC编码器的复杂性。
[0003]HEVC中用于降低编码复杂度的最先进的方法通常可以分为两类:基于统计知识和基于学习的方法。然而,固定阈值、决策树和离线训练的推理模型使这些算法对不断变化的视频内容的灵活性降低。因此,内容自适应决策模型对于在保持编码效率性能不变的同时做出快速CU大小决策至关重要。

技术实现思路

[0004]为了使得编码单元能够更好的基于内容进行划分,本专利技术提出了一种基于内容自适应的帧内图像编码单元划分方法,包括步骤:S1:以目标视频若干帧内图像中的编码单元为训练样本集,获取各训练样本在率失真优化编码下的编码单元划分结果;S2:提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;S3:基于各编码深度下训练样本的第一特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第一参数集训练;S4:基于各编码深度下训练样本的第二特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第二参数集训练;S5:根据第一参数集以及当前预测样本的第一特征向量,通过当前编码深度的第二加权SVM分类器判断预测样本在当前编码深度是否进行划分,若是,进入S6步骤,若否,进入S8步骤;S6:根据第二参数集以及当前预测样本的第二特征向量,通过当前编码深度的第三加权SVM分类器判断预测样本在当前编码深度是否进行划分,若是,进入S7步骤,若否,进入S8步骤;
S7:判断是否到达最大编码深度,若是,进入S8步骤,若否,进入下一编码深度并返回S5步骤;S8:根据预测样本在各编码深度下的划分结果进行帧内图像的划分。
[0005]进一步地,当训练样本的总数与完成划分结果判定的预测样本总数的比例达到预设比例时,所述S8步骤之后还包括步骤:S9:重置各SVM分类器的各项参数并返回S1步骤。
[0006]进一步地,所述S3步骤和S4步骤中,参数训练可表示为如下公式:式中,w为SVM分类器的超平面边距,为SVM分类器的松弛变量,C为SVM分类器的超平面边距宽度,W
ns
为错误划分的权衡参数,W
s
为编码单元划分与不划分的权重参数,N
ns
为不划分的训练样本总数,N
s
为划分的训练样本总数,为初始为1的常数,x
i
={1,2,

,N}为训练样本的特征向量,b为截距,i为训练样本的编号,可表示为{x
i
,y
i
},y
i
为常数1或者

1,当y
i
为1时表示编码单元划分,当y
i


1时表示编码单元不划分。
[0007]进一步地,在第一参数集训练过程中,所述W
ns
和W
s
为通过采集训练样本编码过程中的数据获得,在第二参数集训练过程中,W
ns
和W
s
为通过F

score方法计算获得。
[0008]进一步地,所述第一特征向量集包括当前待测样本的纹理复杂度、估计的率失真代价函数和编码块标识;所述第二特征向量集包括当前待测样本编码需要的比特位信息,以及当前待测样本相邻编码单元的率失真代价函数均值和平均深度。
[0009]本专利技术还提出了一种基于内容自适应的帧内图像编码单元划分系统,包括:训练样本提取模块,用于提取目标视频若干帧内图像中的编码单元作为训练样本集,并获取各训练样本在率失真优化编码下的编码单元划分结果;特征提取模块,用于提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;分类器训练模块,用于基于各编码深度下训练样本的第一特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第一参数集训练;基于各编码深度下训练样本的第二特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第二参数集训练;L1级划分判断模块,用于根据第一参数集以及当前预测样本的第一特征向量,通过当前编码深度的第二加权SVM分类器获取预测样本在当前编码深度的划分判断结果;L2级划分判断模块,用于在L1级划分判断模块判断划分的情况下,根据第二参数集以及当前预测样本的第二特征向量,通过当前编码深度的第三加权SVM分类器获取预测样本在当前编码深度的划分判断结果;编码单元划分模块,用于在任意划分判断模块判段不划分或者达到最大编码深度时,根据预测样本在各编码深度下的划分结果进行帧内图像的划分。
[0010]进一步地,所述编码单元划分模块中还包括重置单元,用于当训练样本的总数与
完成划分结果判定的预测样本总数的比例达到预设比例时,重置各SVM分类器的各项参数并通过训练样本提取模块重新提取训练样本。
[0011]进一步地,所述分类器训练模块中,参数训练可表示为如下公式:式中,w为SVM分类器的超平面边距,为SVM分类器的松弛变量,C为SVM分类器的超平面边距宽度,W
ns
为错误划分的权衡参数,W
s
为编码单元划分与不划分的权重参数,N
ns
为不划分的训练样本总数,N
s
为划分的训练样本总数,为初始为1的常数,x
i
={1,2,

,N}为训练样本的特征向量,b为截距,i为训练样本的编号,可表示为{x
i
,y
i
},y
i
为常数1或者

1,当y
i
为1时表示编码单元划分,当y...

【技术保护点】

【技术特征摘要】
1.一种基于内容自适应的帧内图像编码单元划分方法,其特征在于,包括步骤:S1:以目标视频若干帧内图像中的编码单元为训练样本集,获取各训练样本在率失真优化编码下的编码单元划分结果;S2:提取训练样本中与编码单元划分相关的各样本的第一特征向量集,以及训练样本相邻编码单元中与编码单元划分相关的各样本的第二特征向量集;S3:基于各编码深度下训练样本的第一特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第一参数集训练;S4:基于各编码深度下训练样本的第二特征向量以及相应的划分结果,通过对应编码深度的第一加权SVM分类器进行第二参数集训练;S5:根据第一参数集以及当前预测样本的第一特征向量,通过当前编码深度的第二加权SVM分类器判断预测样本在当前编码深度是否进行划分,若是,进入S6步骤,若否,进入S8步骤;S6:根据第二参数集以及当前预测样本的第二特征向量,通过当前编码深度的第三加权SVM分类器判断预测样本在当前编码深度是否进行划分,若是,进入S7步骤,若否,进入S8步骤;S7:判断是否到达最大编码深度,若是,进入S8步骤,若否,进入下一编码深度并返回S5步骤;S8:根据预测样本在各编码深度下的划分结果进行帧内图像的划分。2.如权利要求1所述的一种基于内容自适应的帧内图像编码单元划分方法,其特征在于,当训练样本的总数与完成划分结果判定的预测样本总数的比例达到预设比例时,所述S8步骤之后还包括步骤:S9:重置各SVM分类器的各项参数并返回S1步骤。3.如权利要求1所述的一种基于内容自适应的帧内图像编码单元划分方法,其特征在于,所述S3步骤和S4步骤中,参数训练可表示为如下公式:式中,w为SVM分类器的超平面边距,为SVM分类器的松弛变量,C为SVM分类器的超平面边距宽度,W
ns
为错误划分的权衡参数,W
s
为编码单元划分与不划分的权重参数,N
ns
为不划分的训练样本总数,N
s
为划分的训练样本总数,为初始为1的常数,x
i
={1,2,

,N}为训练样本的特征向量,b为截距,i为训练样本的编号,可表示为{x
i
,y
i
},y
i
为常数1或者

1,当y
i
为1时表示编码单元划分,当y
i


1时表示编码单元不划分。4.如权利要求3所述的一种基于内容自适应的帧内图像编码单元划分方法,其特征在于,在第一参数集训练过程中,所述W
ns
和W
s
为通过采集训练样本编码过程中的数据获得,在第二参数集训练过程中,W
ns
和W
s
为通过F

score方法计算获得。5.如权利要求1所述的一种基于内容自适应的帧内图像编码单元划分方法,其特征在于,所述第一特征向量集包括当前待测样本的纹理复杂度、估计的率失真代价函数和编码
块标识;所述第二特征向量集包括当前待测样本编码需要的比特位信息,以及当前待测样本相邻编码单元的率失真代价函数均值和平均深度。6.一种基于内容自适应的帧内...

【专利技术属性】
技术研发人员:蒋先涛张纪庄郭咏梅郭咏阳
申请(专利权)人:宁波康达凯能医疗科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1