【技术实现步骤摘要】
一种基于分类的内容自适应VVC帧内编码快速划分方法
[0001]本专利技术涉及视频压缩编码
,具体地,涉及一种基于分类的内容自适应VVC帧内编码快速划分方法。
技术介绍
[0002]目前,国际上最新一代视频编码标准VVC能大大节省压缩视频的码率,但是代价却是计算复杂度剧烈的增加。VVC的参考软件VTM10.0与HEVC的参考软件16.22相比,码率平均被降低了36.06%但是时间复杂度却也变成原来的859%。这样的时间复杂度在实际应用中是完全不能被接受的。而主流的快速划分算法是通过机器学习或者深度学习的工具,牺牲部分码率资源换取时间复杂度的降低,但是码率资源本就很宝贵,他们的算法虽获得了较大的时间复杂度节省但是也损失了相当一部分的码率资源,对二者的权衡并不是很好。
技术实现思路
[0003]针对现有技术中的缺陷,本专利技术的目的是提供一种基于分类的内容自适应VVC帧内编码快速划分方法。
[0004]根据本专利技术的一个方面,提供一种基于分类的内容自适应VCC帧内编码快速划分方法,包括:
...
【技术保护点】
【技术特征摘要】
1.一种基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,包括:将待压缩视频进行场景切换检测,分类成若干个不同场景;对于每个所述的不同的场景,使用同一个基于支持向量机的模型;每个场景内首帧用于所述模型的训练;场景内其他帧用训练好的模型进行预测划分;通过所述预测划分,将不能执行的划分方式移出候选模式队列。2.根据权利要求1所述的基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,所述将待压缩视频分成若干个不同场景,包括:对于所有I帧图像按照显示顺序建立一个I帧图像队列L,对其中的每幅图像I
i
与其前一幅相邻图像I
i
‑1进行场景切换检测,获得不同场景;检测到当前帧与前一相邻帧发生了场景切换时,将当前帧设置为训练帧,否则当前帧为预测帧;其中,所述场景切换检测,包括:将I
i
帧图像与I
i
‑1帧图像分别划分成32x32的小块,第i帧图第k个块的平均灰度值表示为B
i,k
,图像内32x32块总数量为N;计算B
i,k
与B
i
‑
1,k
的差值的绝对值并记为E
i,k
,比较完所有块;比较第i帧内全部E
i,k
与设定的阈值Thr的大小,若E
i,k
≥Thr,则场景切换计数Cnt
sc
加一,若Cnt
sc
≥0.6N,则第i帧被视为发生了场景切换,其中,Cnt
SC
初始值为0,下一帧进行检测时重新开始计数。3.根据权利要求2所述的基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,所述对于每个不同的场景,所述场景内首帧用于模型的训练,场景内其他帧用训练好的模型进行预测;通过预测,将不可能的划分方式移出候选模式队列,包括:对当前帧以块为单位进行编码决策,提取特征向量;所述当前帧为训练帧,额外提取块划分信息,将所述特征向量和所述块划分信息存入训练数据集,以进行模型训练,获得支持向量分类器;所述当前帧为预测帧,将所述特征向量输入到训练好的支持向量机分类器进行预测;根据所述预测结果判断是否将划分方式移出候选划分模式队列。4.根据权利要求3所述的基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,所述对当前帧以块为单位进行编码决策,提取特征向量,包括:判断当前图像块是否为32x32,若非,则按编码器原始决策算法进行决策;若是,判断当前帧是否为训练帧:若当前帧为训练帧:提取出当前块的梯度特征G、信息熵特征E和邻域深度差D,组成1x3特征向量F;获取当前块按照编码器原始决策算法决策出的最佳划分方式S
best
并推导出划分标志Y
bth
、Y
btv
、Y
tth
、Y
ttv
、Y
qt
,分别表示是否为水平二叉树划分、垂直二叉树划分、水平三叉树划分、垂直三叉树划分、四叉树划分;若当前帧为预测帧:提取出当前块的梯度特征G、信息熵特征E和邻域深度差D,构成特征向量F。5.根据权利要求4所述的基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,所述当前帧为训练帧,将特征向量和块划分信息存入训练数据集,以进行模型训练,获
得支撑向量分类器,包括:将当前块对应的特征向量F分别与五个不同的划分标志组合构造成训练样本,存入五个不同的训练数据集;对当前帧的所有32x32的块,重复上述操作,更新所述五个训练数据集;对于所述五个训练数据集中的每个样本进行归一化;利用所述五个归一化后的训练数据集训练出五个不同的支持向量机分类器C
bth
、C
btv
、C
tth
、C
ttv
、C
qt
;所述支持向量机分类器用于此训练帧之后、下一个训练帧之前的所有预测帧。6.根据权利要求5所述的基于分类的内容自适应VCC帧内编码快速划分方法,其特征在于,所述当前帧为预测帧,将特征向量输入到训练好的支撑向量机分类器进行预测;根据所述预测结果判断是否将划分方式移除候选划分模式队列,包括:将所述特征向量的输入特征G、E、D根据训练时得到的G
max
、E
max
、D
max
、G
min
、E
min
、D
min
进行限幅;输入特征G、E、D组合得到特征向量F,并输入训练好的对应的支持向量机分...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。