【技术实现步骤摘要】
基于强化学习的VVC的快速帧内编码方法
本专利技术涉及视频编码
,特别是一种基于强化学习的VVC的快速帧内编码方法。
技术介绍
近年来,随着视频技术的高速发展,以及人们对高质量视频的需求,各种高质量、高分辨率视频已经和我们的生活密切联系,不可分割。同时,4K、8K超高清、全景视频等先进视频应用也在进一步发展与普及。但是,有限的带宽一直是制约视频技术发展的重要因素。因此,对更加有效的视频编码的研究迫在眉睫。联合视频专家小组(JointVideoExpertsGroup,JVET)于2018年4月10日美国圣地亚哥会议上,为新一代视频编码标准定名为多功能视频编码(VersatileVideoCoding,VVC),主要目标是改进现有高效视频编码(HighEfficiencyVideoCoding,HEVC),提供更高的压缩性能,同时针对新兴应用如360°全景视频和高动态范围成像(HighDynamicRangeImaging,HDR)进行优化。相比较HEVC而言,VVC的编码性能提升一倍。但是,与HEVC对CU的划 ...
【技术保护点】
1.一种基于强化学习的VVC的快速帧内编码方法,其特征在于,包括如下步骤:/n步骤S1、基于强化学习理论和Q学习的深度强化学习模型,即DQN模型,确定模型参数,目标神经网络的价值反馈函数、损失函数;/n步骤S2、采用离线训练方法,训练强化学习模型;/n步骤S3、利用步骤S2中训练好的强化学习模型,对编码单元CU的划分模式进行预测,并选择最优CU划分模式,以跳过未被选择的CU划分模式,从而节省帧内编码的编码时间。/n
【技术特征摘要】
1.一种基于强化学习的VVC的快速帧内编码方法,其特征在于,包括如下步骤:
步骤S1、基于强化学习理论和Q学习的深度强化学习模型,即DQN模型,确定模型参数,目标神经网络的价值反馈函数、损失函数;
步骤S2、采用离线训练方法,训练强化学习模型;
步骤S3、利用步骤S2中训练好的强化学习模型,对编码单元CU的划分模式进行预测,并选择最优CU划分模式,以跳过未被选择的CU划分模式,从而节省帧内编码的编码时间。
2.根据权利要求1所述的基于强化学习的VVC的快速帧内编码方法,其特征在于,所述步骤S1具体实现如下:
步骤S11、根据DNQ模型,以及结合帧内编码的实际情况,由于CU进行划分后会有多个子CU,因此将目标神经网络的价值反馈函数定义如下:
其中,N表示采用划分模式后得到的子CU个数;S表示在不同的划分模式下所对应的CU状态;A表示在状态S下可执行的划分动作,在VVC快速帧内编码中,每个CU对应着四叉树划分、二叉树水平划分、二叉树垂直划分、三叉树水平划分、三叉树垂直划分五种划分动作模式;Q(S,A)表示在状态S下,执行动作A之后的价值反馈函数;S′n表示第n个CU在状态S执行划分动作A之后的下一个状态,即CU划分之后的状态;A′n表示状态为第n个CU在状态S′n下,可继续执行的划分动作;Q′(S′n,A′n)表示在S′n状态下,执行A′n动作后的价值反馈函数,该函数的引入,使得对当前状态S进行价值估计时,可以考虑到未来的状态价值对当前的影响;γ是一个衰减因子,范围为0到1,且γ越大,表示下一个CU的状态对当前CU状态的影响越大;R为状态S下执行动作A所获得的即时反馈值,R定义如下:
R=Rintra-RA
其中,Rintra表示CU帧内预测时的率失真代价值,即RDcost值;RA表示CU帧内预测时,采用划分模式A时的RDcost值;
对于强化学习来说,损失函数用于衡量经过学习所得到的模型性能的好坏,损失函数L的定义如下:
L=(Q′(S,A)-Q(S,A))2
其中,Q′(S,A)为目标函数;损失函数的引入,希望DQN网络在训练中所取得的价值反馈函数不断逼近目标函数;
步骤S12、基于步骤S11确定的价值反馈函数,选取3个与编码划分模式相关的编码参数(s1-s3)以及8个与视频残差图像相关的参数(s4-s11),作为状态S中的状态特征,s1-s11的具体定义分别为:当前CU的帧内预测RDcost值、量化参数Qp、CU大小、CU亮度预测残差图的像素值方差、CU采取四叉划分后4个子CU块像素值方差的均值、CU亮度预测残差图采取二叉树水平划分后4个子CU块像素值方差的均值、CU亮度预测残差图采取二叉树垂直划分后,4个子CU块像素值方差的均值、CU亮度预测残差图采取三叉树水平划分后4个子CU块像素...
【专利技术属性】
技术研发人员:徐艺文,邢开应,林杰廉,吴陆狄,郑权斐,
申请(专利权)人:福州大学,
类型:发明
国别省市:福建;35
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。