当前位置: 首页 > 专利查询>武汉大学专利>正文

一种考虑长距离时序信息的视频压缩方法及系统技术方案

技术编号:37423786 阅读:33 留言:0更新日期:2023-04-30 09:45
本发明专利技术公开了一种考虑长距离时序信息的视频压缩方法及系统,将视频序列或视频特征输入视频压缩模型中,编码时视频压缩模型生成对应的码流,解码时视频压缩模型从码流中重建出对应的视频序列或特征;本发明专利技术构建出了一种端到端优化的视频压缩框架,经过运动补偿生成当前压缩对象的上下文,再根据上下文信息辅助当前帧的压缩。本发明专利技术提出使用时序先验实现高效的长距离时序信息利用。在一个图像组中,由首个参考帧初始化时序先验,并在压缩过程中迭代补充更新时序先验,使其时刻保持与当前压缩帧的空间相关性。时序先验用于辅助预测运动信息与当前帧的高斯分布参数预测。与当前帧的高斯分布参数预测。与当前帧的高斯分布参数预测。

【技术实现步骤摘要】
一种考虑长距离时序信息的视频压缩方法及系统


[0001]本专利技术属于端到端优化视频压缩
,涉及一种视频压缩方法及系统,特别涉及一种考虑长距离时序信息的视频压缩方法及系统。

技术介绍

[0002]视频压缩是信号处理和计算机视觉领域的一项基本技术。如今,大众对更高的分辨率、帧率和动态范围的视频内容的需求不断增加,使得对高效视频压缩方法的需求变得更加迫切。广泛采用的传统视频编解码器,随着近几十年来全球专家的不断改进,已经取得了相当高效的率失真性能。尽管如此,它们在优化方案和优化目标方面还是遇到了限制。传统的视频编解码器是以混合编码框架形式设计的,严重依赖手工设计的各项技术来提高压缩效率。其中的子模块被单独设计与优化,但无法同时进行优化,因此限制了压缩潜力。此外,混合编码框架很难面向复杂的目标指标进行优化,如多尺度结构相似性指标和视觉感知指标。综上所述,考虑到视频内容的独特性和深度学习技术的快速发展,探索新的视频编码框架和范式成为了当前发展未来视频编解码器的重要趋势。
[0003]随着深度学习的快速发展,人工神经网络的潜力被进一步探索,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种考虑长距离时序信息的视频压缩方法,其特征在于:将视频序列或视频特征输入视频压缩模型中,编码时所述视频压缩模型生成对应的码流,解码时所述视频压缩模型从码流中重建出对应的视频序列或特征;所述视频压缩模型,包括运动估计模块、运动信息编码解码模块、先验编码网络、运动信息熵估计模块、运动补偿模块、上下文编码器、上下文解码器、上下文信息熵估计模块以及时序先验初始化及补充与更新模块;压缩过程以迭代循环的方式进行,取前一帧已解码的视频帧作为参考帧,当前编码的视频帧为当前帧;首先利用参考帧通过所述时序先验初始化及补充与更新模块初始化或补充当前时序先验,再使用所述运动估计模块生成参考帧与当前帧之间的运动信息;然后使用时序先验通过先验编码网络处理后辅助运动信息编码解码模块压缩与解压缩运动信息,生成对应的码流,并从码流中恢复运动信息;运动信息熵估计模块用于生成高斯参数,估算运动信息各元素概率,辅助压缩与解压缩;接着使用解码得到的运动信息与参考帧通过所述运动补偿模块完成运动补偿,得到当前帧的上下文信息,同时时序先验也通过运动信息进行更新;将当前帧信息与上下文信息融合,并使用时序先验通过先验编码网络处理后辅助所述上下文编码器压缩融合信息,最后使用所述上下文解码器从码流中重建出当前视频帧,在此过程中上下文信息熵估计模块用于生成对应的高斯分布参数,估算各像素概率,辅助压缩与解压缩;当前参考帧完成编解码流程后,将作为下一压缩循环的参考帧辅助下一视频帧的压缩。2.根据权利要求1所述的考虑长距离时序信息的视频压缩方法,其特征在于:所述运动估计模块,由六个级联的特征提取基础模块组成,而特征提取基础模块由五个连续的卷积层组成;其中卷积层的卷积核大小为7,步长为1,每层卷积后均加入激活层进行特征非线性变换;最终运动估计模块的输出为通道数为2,分辨率与原图一致的光流场。3.根据权利要求1所述的考虑长距离时序信息的视频压缩方法,其特征在于:所述运动信息编码解码模块由运动信息编码器和运动信息解码器组成;所述运动信息编码器,由四个级联的特征编码模块组成;特征编码模块包含一个卷积层,一个残差连接层与一个降采样模块;其中卷积层的卷积核大小为5,步长为1;残差连接层中的卷积核大小依次为1,3,1,步长为1;降采样模块为卷积核大小为5,步长为2的卷积层;所述运动信息解码器,由四个级联的特征解码模块组成;特征编码模块包含一个卷积层,一个残差连接层与一个上采样模块;其中卷积层的卷积核大小为5,步长为1;残差连接层中的卷积核大小依次为1,3,1,步长为1;上采样模块为一个卷积层加上空间混合操作,其卷积层的卷积核大小为3,步长为1。4.根据权利要求1所述的考虑长距离时序信息的视频压缩方法,其特征在于:所述运动信息熵估计模块和上下文信息熵估计模块,均为带掩膜的棋盘格卷积层,卷积核大小为5,步长为1。5....

【专利技术属性】
技术研发人员:陈震中王怀睿
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1