一种基于图神经网络的VVC视频编码单元划分方法技术

技术编号:42149138 阅读:28 留言:0更新日期:2024-07-27 00:03
一种基于图神经网络的VVC视频编码单元划分方法,属于视频编码技术领域,包括S1:收集VVC编码的视频数据,提取编码单元的特征和标签信息;S2:根据CU之间的空间关系或时间关系构建边;设计基于图注意力神经网络GNN,再通过图注意力网络设计一个能够同时利用节点和边信息的信息传递机制;S3:使用交叉熵损失函数解决CU划分的六分类问题,然后使用SGD优化器进行训练;S4:基于图神经网络的CU划分;S5:将训练好的模型部署到实际的VVC编码系统中,以自动预测和优化编码单元的划分模式。本发明专利技术将CU的划分问题建模为多分类问题。在图神经网络的输出特征基础上,使用分类器对CU进行分类,从而降低编码的复杂度。

【技术实现步骤摘要】

本专利技术属于视频编码,具体涉及一种基于图神经网络的 vvc 视频编码单元划分方法。


技术介绍

1、h.266/vvc(versatile video coding)是一种高效的视频编码标准,其编码框架是指整体的结构和组织,包括各个编码单元(coding unit, cu)以及编码的各个步骤。以下是 h.266/vvc 编码框架的基本组成部分:(1) 编码单元层次结构: h.266/vvc 引入了一种灵活的编码单元层次结构,其中最大的编码单元被称为ctu(coding tree unit)。ctu 可以被划分为更小的块,包括 cu等。这种层次结构允许根据视频内容的特性进行不同粒度的划分。(2) 预测模式: h.266/vvc 采用了多种预测模式,用于在帧间进行运动估计和运动补偿。这些预测模式包括了不同类型的运动矢量预测和帧间差异预测,以提高编码效率和视频质量。(3) 变换和量化:在帧内编码中,h.266/vvc 使用了一种叫做“异形变换”的方法,用于将图像块从空间域转换为频域。这种变换能够更好地适应图像中的纹理和结构。然后,经过量化和熵编码,以减少编码后的本文档来自技高网...

【技术保护点】

1.一种基于图神经网络的 VVC 视频编码单元划分方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于图神经网络的 VVC 视频编码单元划分方法,其特征在于,在步骤S1中,所述视频数据包括原始视频帧和经过编码处理后的数据,所述编码单元的特征和标签信息包括编码单元的尺寸、纹理、运动矢量、纹理信息、编码深度特征、以及采用的划分模式。

3.如权利要求1所述的一种基于图神经网络的 VVC 视频编码单元划分方法,其特征在于,在步骤S2中,所述空间关系基于 CU 在帧中的位置建立,所述时间关系基于连续帧中CU 的位置和运动向量建立。

>4.如权利要求1所...

【技术特征摘要】

1.一种基于图神经网络的 vvc 视频编码单元划分方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于图神经网络的 vvc 视频编码单元划分方法,其特征在于,在步骤s1中,所述视频数据包括原始视频帧和经过编码处理后的数据,所述编码单元的特征和标签信息包括编码单元的尺寸、纹理、运动矢量、纹理信息、编码深度特征、以及采用的划分模式。

3.如权利要求1所述的一种基于图神经网络的 vvc 视频编码单元划分...

【专利技术属性】
技术研发人员:蒋先涛靖永慧张镇谢东明许晓洁靖婉琦许得龙李会东刘晨甲徐如明宋光恒
申请(专利权)人:聊城莱柯智能机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1