一种频域特征感知学习的图像编码、解码、压缩方法技术

技术编号:40016237 阅读:32 留言:0更新日期:2024-01-16 16:03
本发明专利技术公开一种频域特征感知学习的图像编码、解码、压缩方法,包括:通过频域特征感知学习模块组成的编码网络获取待编码图像的第一和第二特征图;获取第二特征图的超先验特征二进制码流及超先验信息;将第二特征图划分为多个通道分组;将每个通道分组的分布参化建模为高斯分布,通过基于Transformer的通道自回归熵模型来预测高斯分布的均值、方差;根据高斯分布对第二特征图进行概率估计,并进行算术编码,获得每个通道分组的特征二进制码流并合并为特征二进制码流,与超先验特征二进制码流合并,得到压缩图像二进制码流。本发明专利技术可以提取更为紧凑的隐变量,能够精确地对三维特征的分布进行建模和估计码率,提升图像压缩的率失真性能。

【技术实现步骤摘要】

本专利技术属于图像压缩领域,涉及的是一种端到端图像压缩方法,具体地说,涉及一种基于频域特征感知学习的图像编码、解码以及压缩方法。


技术介绍

1、最近,基于深度学习的图像压缩模型成为图像存储和传输的一种有前景的解决方案,并在速率失真度量中优于传统编解码器。从理论上讲,基于深度学习的图像压缩模型中的非线性变换为多维量化器提供了更适应性的量化单元,超越了变换编码方案的构造限制。因此,为了降低编码后的码率,该非线性变换成为端到端图像压缩中的一个重要课题。

2、经过对现有技术的文献检索发现,minnen等人在2018年的conference andworkshop on neural information processing systems会议上发表的“jointautoregressive and hierarchical priors for learned image compression,采用卷积神经网络(cnn)来实现非线性分析和合成变换。然而,cnn的局部感受野限制了其代表能力,并导致冗余的潜在表示。为了解决这个问题,最近的研究采用了注本文档来自技高网...

【技术保护点】

1.一种频域特征感知学习的图像编码方法,其特征在于,包括:

2.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述将待编码图像通过多个频域特征感知学习模块构成的编码网络,获得频率分解特征图,作为第一特征图,包括:

3.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述获取所述第二特征图的超先验特征二进制码流以及超先验信息,包括:

4.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述采用基于Transformer的通道自回归模型来建立各个分组的通道上下文关系,结合超先验信息来预测各个分组的高斯分布的...

【技术特征摘要】

1.一种频域特征感知学习的图像编码方法,其特征在于,包括:

2.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述将待编码图像通过多个频域特征感知学习模块构成的编码网络,获得频率分解特征图,作为第一特征图,包括:

3.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述获取所述第二特征图的超先验特征二进制码流以及超先验信息,包括:

4.根据权利要求1所述的频域特征感知学习的图像编码方法,其特征在于,所述采用基于transformer的通道自回归模型来建立各个分组的通道上下文关系,结合超先验信息来预测各个分组的高斯分布的均值、方差,包括:

5.根据权利要求4所述的频域特征感知学习的图像编码方法,其特征在于,任一层transformer网络包括一个分...

【专利技术属性】
技术研发人员:戴文睿李涵李成林邹君妮熊红凯
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1