一种基于边信息自回归的学习图像压缩方法技术

技术编号:44603792 阅读:24 留言:0更新日期:2025-03-14 12:57
本发明专利技术公开了一种基于边信息自回归的学习图像压缩方法,以自然图像x为输入,获得紧凑的潜在表示y,实际压缩图像x时直接编码y;将潜在表示y作为输入,获得边信息z,边信息z用来为潜在表示y的熵编码提供先验指导;使用边信息自回归模块估计边信息z的概率分布,熵编码后形成边信息z的压缩的比特流;将量化的边信息z送入超合成变换模块得到潜在表示y的超先验信息;利用潜在表示y的上下文和超先验信息估计潜在表示y的概率分布,熵编码后形成潜在表示y的压缩的比特流;将量化的潜在表示y送入合成变换模块得到最终重建图像本发明专利技术所得到的重建图像在结构相似性客观指标上表现更加出色,主观质量上得到的重建图像纹理细节重建的更好。

【技术实现步骤摘要】

本专利技术属于计算机视觉、数据压缩,用于图像压缩和传输等行业,具体是一种基于边信息自回归的学习图像压缩方法


技术介绍

1、由于互联网和计算机的快速发展,不断产生着巨量的图像数据。这对图像的传输和存储提出了重大挑战。因此,人们一直在寻找更高效的图像压缩方法,以尽可能低的比特率保持更高的图像质量。传统的图像编码方案,如jpeg、avc、hevc和vvc,虽然取得了显著的性能,但它们的模块并没有最优化地集成,每个组件都依赖于手动设计。这大大限制了传统图像压缩编解码器的性能。

2、近年来,基于学习图像压缩(lic)模型(johannes ballé、li、minnen、hu等人提出的模型)取得了重大进展。特别是,一些先进的方法(minnen、cheng、gao、zou、chen、he、jiang、li等人提出的方法)已经超越了传统的图像压缩标准,如vvc。神经网络的端到端优化能力使它们能够在统一目标下整合和协调内部组件,使得基于学习的图像压缩技术逐渐成为更好的选择。目前,大多数图像压缩模型都是基于变分自编码器框架构建的,并遵循固定的处理流程:变换、量本文档来自技高网...

【技术保护点】

1.一种基于边信息自回归的学习图像压缩方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于边信息自回归的学习图像压缩方法,其特征在于,网络模型的整体网络框架,包括一个分析变换网络ga,用于剔除图片中存在的冗余信息,得到紧凑的潜在表示y;一个合成变换网络gs,用于将潜在表示y重建回原始图像;一个超分析变换网络ha,用于从紧凑的潜在表示y中抽取边信息,用来帮助估计y的超先验信息;一个超合成变换网络hs,将边信息转变成y的超先验信息,以及一个潜在表示熵模型,用来估计潜在表示的概率分布,和一个边信息熵模型,用来估计边信息的概率分布。

3.根据权利要求2所述的...

【技术特征摘要】

1.一种基于边信息自回归的学习图像压缩方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于边信息自回归的学习图像压缩方法,其特征在于,网络模型的整体网络框架,包括一个分析变换网络ga,用于剔除图片中存在的冗余信息,得到紧凑的潜在表示y;一个合成变换网络gs,用于将潜在表示y重建回原始图像;一个超分析变换网络ha,用于从紧凑的潜在表示y中抽取边信息,用来帮助估计y的超先验信息;一个超合成变换网络hs,将边信息转变成y的超先验信息,以及一个潜在表示熵模型,用来估计潜在表示的概率分布,和一个边信息熵模型,用来估计边信息的概率分布。

3.根据权利要求2所述的一种基于边信息自回归的学习图像压缩方法,其特征在于,所述s3中,为鼓励神经网络分配比特率,图像中每一个像素点的每一个数值所占的比特数,使用更精确的边信息熵模型;提出一个即插即用的边信息自回归sia模块来作为边信息熵模型;为了更准确地建模边信息的概率分布,采用逐通道的自回归方法,将边信息z沿着通道维度分割成l个切片,即将一个tensor z沿着通道切分成多个tensor{z0,z1,…,zl-1}),每个切片{z0,z1,…,zl-1}包含...

【专利技术属性】
技术研发人员:施云惠任佳辉王瑾尹宝才
申请(专利权)人:北京工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1