当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于隐式神经表示的质量可伸缩视频编码方法技术

技术编号:41491971 阅读:23 留言:0更新日期:2024-05-30 14:37
一种基于隐式神经表示的质量可伸缩视频编码方法,包括:原始视频预处理;构建质量可伸缩的视频隐式神经表示网络,包括一个基本层和多个增强层网络,基本层网络包括内容编码器、上下文编码器和解码器,每个增强层网络包括残差编码器和解码器;训练并优化模型;将基本层解码器、增强层解码器和每一帧经过编码器编码后的嵌入作为压缩数据进行压缩,得到可分层的视频码流;根据需求发送并解压缩部分层的视频码流,将每一帧的特征嵌入输入解码器,输出对应的重构图像,按顺序排列,得到解码的视频。本发明专利技术将视频按照渐进质量分层编码在一个分层结构的隐式神经网络中,从而节省了训练时间和存储空间,并显著提高视频的重建质量。

【技术实现步骤摘要】

本专利技术涉及视频编码和深度学习领域,特别涉及一种基于隐式神经表示的质量可伸缩视频编码方法


技术介绍

1、视频数据激增,给存储和传输带来了沉重的负担,因此视频压缩技术成为一个重要的研究课题。传统的视频编码标准基于手工设计的模块已经取得良好表现,近年来随着深度学习的快速发展,结合神经网络的视频编码方法得到进一步提高,然而这些方法由于其复杂的框架和网络结构,计算量巨大,解码效率较低。

2、隐式神经表示(inrs)先前已被用于表示和压缩图像和视频内容,与其他方法相比,显示出相对较高的解码速度。在此之前的其他编码方法用一个通用的编解码网络编解码所有视频,而基于隐式神经表示的视频编码方法为每个视频训练一个专用的网络,这个网络只需要过拟合需要编码的视频,从而将视频编码为一个网络,编码是训练一个神经网络过拟合视频,解码是将训练好的神经网络正向传播重建视频的过程,由于神经网络就是码流本身,其通常结构简单且参数较少,有较快的解码速度。

3、最接近现有技术及其评析:dupont等人(dupont e,goliński a,alizadeh m,eta本文档来自技高网...

【技术保护点】

1.一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,所述步骤2:

3.如权利要求2所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,

4.如权利要求2所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,

5.如权利要求1所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,所述步骤4:

6.如权利要求1所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,所述步骤6:

...

【技术特征摘要】

1.一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,包括如下步骤:

2.如权利要求1所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,所述步骤2:

3.如权利要求2所述的一种基于隐式神经表示的质量可伸缩视频编码方法,其特征在于,

4.如权利要求2所述的一种基于隐式神经表示的质量可伸缩...

【专利技术属性】
技术研发人员:张冬冬曹乾
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1