一种基于图神经网络的VVC帧内编码快速块划分方法技术

技术编号:40550102 阅读:28 留言:0更新日期:2024-03-05 19:08
本发明专利技术提供一种基于图神经网络的VVC帧内编码快速块划分方法,包括具有纹理特征编码器、多叉树特征编码器和标签预测器的基于图神经网络的编码单元划分结构预测网络模型搭建,基于多阈值的快速块划分决策方法设置,编码单元划分结构预测网络模型训练与参数优化,以及基于图神经网络的VVC帧内编码快速块划分方法流程。本申请使用卷积神经网络和图神经网络学习编码单元重要纹理信息,引入十字交叉注意力和多叉树特征编码器以实现多维度特征的交互融合,并将编码单元的量化参数进行归一化后输入网络模型,实现对最优划分结构的精准预测,之后再通过预测结果优化块划分流程,实现不降低整体编码效率的前提下大幅度提升VVC的运行速度。

【技术实现步骤摘要】

本专利技术涉及深度学习智能编码,具体涉及一种基于图神经网络的vvc帧内编码快速块划分方法。


技术介绍

1、高效视频编码(hevc/h.265)是视频编码联合协作组(jct-vc)于2013年制定的应用最广泛的视频编码标准。由于其优异、稳定的性能,hevc在当今的视频传输、流媒体直播和在线视频播放中发挥着重要作用。然而,随着高动态范围、360度全景视频、虚拟现实视频等新一代视频压缩算法的应用,视频数据量呈指数级增长。在这种情况下,hevc已经无法满足高效视频压缩的要求。为此,国际标准化组织iso/iec、mpeg和itu-t vceg于2015年10月成立了联合视频小组(jvet),制定新一代视频编码标准,即通用视频编码(vvc/h.266)。vvc中引入了许多先进的视频编码技术,包括嵌套多类型树的四叉树、跨分量线性模型、位置相关预测组合、多参考线、帧内子分区、矩阵加权帧内预测和扩展角度预测。值得一提的是,通过应用这些强大的编码技术,在保持相同编码性能的情况下,vvc比hevc可以节省近一半的比特率。

2、其中,基于嵌套多类型树的四叉树(qtmt本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的VVC帧内编码快速块划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图神经网络的VVC帧内编码快速块划分方法,其特征在于,所述步骤S12中,初始卷积层的卷积核大小为3×3,步长为1,Padding为1,卷积核数量为24、48和48;图卷积计算包括重塑形状的图节点矩阵建立层、基于K近邻算法的图结构建立层以及特征变换层,K近邻算法的K取值为9,两个图卷积块中各个卷积层的卷积核数量依次为48、96、240、384;标签预测器中全连接层输出端点对应的节点数依次为398、256、64、6,最后得到一个长度为6的一维向量作为六个划分结构各自的预测...

【技术特征摘要】

1.一种基于图神经网络的vvc帧内编码快速块划分方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于图神经网络的vvc帧内编码快速块划分方法,其特征在于,所述步骤s12中,初始卷积层的卷积核大小为3×3,步长为1,padding为1,卷积核数量为24、48和48;图卷积计算包括重塑形状的图节点矩阵建立层、基于k近邻算法的图结构建立层以及特征变换层,k近邻算法的k取值为9,两个图卷积块中各个卷积层的卷积核数量依次为48、96、240、384;标签预测器中全连接层输出端点对应的节点数依次为398、256、64、6,最后得到一个长度为6的一维向量作为六个划分结构各自的预测概率,所述六个划分结构依次为四叉树划分、水平二叉树划分、垂直二叉树划分、水平三叉树划分、垂直三叉树划分和不划分。

3.根据权利要求1所述的基于图神经网络的vvc帧内编码快速块划分方法,其特征在于,所述步骤s34中网络前向计算包括卷积操作、图卷积操作、批量归一化、非线性激励、特征组合和标签映射、概率值转换。

4.根据权利要求3所述的基于图神经网络的vvc帧内编码快速块划分方法,其特征在于,所述卷积操作运算中,任意一个卷积核所对应的输出特征图zi采用下式进行计算:

5....

【专利技术属性】
技术研发人员:黎天送刘昊坤崔少国张乐迁万皓明
申请(专利权)人:重庆师范大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1