一种用于视频编码的残差信息压缩方法技术

技术编号:24946627 阅读:34 留言:0更新日期:2020-07-17 23:04
本发明专利技术提供一种用于视频编码的残差信息压缩方法,涉及信息压缩、编解码领域,通过使用自编码器的思想,将残差信息通过训练好的编码器网络进行提取,生成一个特征图,然后通过量化降低数据的存储空间,再用熵编码将量化后的数据进行进一步压缩。残差信息解码的时候,使用相反的流程,将保存的熵编码数据解码并反量化,并通结构相反的解码器进行解码,从特征图恢复为三通道的残差信息。通过对已有的残差信息进行压缩或二次压缩,成倍的减少存储空间,减少存储成本。

【技术实现步骤摘要】
一种用于视频编码的残差信息压缩方法
本专利技术涉及信息压缩、编解码领域,尤其涉及一种用于视频编码的残差信息压缩方法。
技术介绍
在数字媒体时代,大量的图像视频数据从日常生活、网络社交、治安监控、工业生产等领域产生并存储下来,需要耗费大量的存储空间。目前主流的视频压缩格式h264压缩率仍有提升空间,基于块的运动估计也会产生色差,尚未普及的h265由于压缩效率低,以及各种专利纠纷问题,因此不被看好。运动补偿是通过先前的局部图像来预测、补偿当前的局部图像,它是减少帧序列冗余信息的有效方法。它与真实的视频信息通常存在一个残差,残差信息可以补全运动补偿过程中所丢失的信息。鉴于人工智能领域的各项任务已经大规模应用神经网络和深度学习技术,因此借助神经网络对数据进行压缩很有前景。
技术实现思路
基于以上技术问题,本专利技术提出了一种用于视频编码的残差信息压缩方法,可以在低比特率的情况下获得压缩后的残差信息,用于视频压缩的运动估计后残差信息的存储和压缩。本专利技术基于自编码器的神经网络结构,使用GDN激活函数,并结合量本文档来自技高网...

【技术保护点】
1.一种用于视频编码的残差信息压缩方法,其特征在于,/n基于自编码器的神经网络结构,使用GDN激活函数,并结合量化和熵编码进行残差信息压缩。/n

【技术特征摘要】
1.一种用于视频编码的残差信息压缩方法,其特征在于,
基于自编码器的神经网络结构,使用GDN激活函数,并结合量化和熵编码进行残差信息压缩。


2.根据权利要求1所述的方法,其特征在于,
通过添加内部的尺寸限制,以及训练数据增加噪声,并训练自编码器使其恢复原有的数据,这样强制它学习到数据的高效表示。


3.根据权利要求2所述的方法,其特征在于,
得到高效表示之后,再对其量化来达到进一步压缩的效果;
量化之后的特征值需要进行熵编码来进一步压缩。


4.根据权利要求3所述的方法,其特征在于,
熵编码属于对数据的无损压缩,通过识别和消除统计冗余的部分来减少比特,这使得其在执行压缩时不会丢失信息。


5.根据权利要求4所述的方法,其特征在于,
通过使用自编码器的思想,将残差特征用于训练自编码器网络;然后使用训练好的编码器网络进行提取,生成一个特征图,然后通过量化降低数据的存储空间,再用熵编码将量化后的数据进行进一步压缩;残差信息解码的时候,使用相反的流程,将保存的熵编码数据解码并反量化,并通结构相反的解码器进行解码,从特征图恢复为残差信息。


6.根据权利要求5所述的方法,其特征在于,
步骤包括:搭建神经网络架构,编码,量化,熵编码,保存生成文件,熵解码和解码;
其中,网络结构至少应包括一组通过设置Strides降采样的卷积层,一组设置Strides上采样的反卷积层和一组用于量化和熵编码的层。


7.根据权利...

【专利技术属性】
技术研发人员:段强汝佩哲李锐金长新
申请(专利权)人:济南浪潮高新科技投资发展有限公司
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1