图像压缩方法、装置、设备、计算机程序产品及介质制造方法及图纸

技术编号:39284721 阅读:8 留言:0更新日期:2023-11-07 10:56
本发明专利技术提供了一种图像压缩方法,装置、设备及介质,方法包括:对待压缩图像进行编码,得到所述待压缩图像对应的第一隐变量;确定所述第一隐变量对应的超先验概率估计值;根据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述第一隐变量的部分解码结果;根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,其中,所述压缩后图像的体积小于所述待压缩图像。本发明专利技术能够提升图像的压缩效率,节省压缩后的图像占用的存储空间。节省压缩后的图像占用的存储空间。节省压缩后的图像占用的存储空间。

【技术实现步骤摘要】
图像压缩方法、装置、设备、计算机程序产品及介质


[0001]本专利技术涉及机器学习技术,尤其涉及一种图像压缩方法、装置、电子设备、计算机程序产品及存储介质。

技术介绍

[0002]相关技术中,深度神经网络在许多计算机视觉任务中获得了非常好的性能。但是在通过神经网络模型对图像进行压缩时,目前的主流方法使用基础的卷积网络对进行图像变换,在压缩率较低时,需要从字节流中恢复隐变量重建高质量图像,而图像非线性变换网络的能力限制网络重建高质量图像的能力;同时目前的主流上下文模型使用PixelCNN串行解码,使得图像压缩的效率较低。

技术实现思路

[0003]有鉴于此,本专利技术实施例提供一种图像压缩方法、装置、电子设备、计算机程序产品及存储介质,能够通过利用图像处理模型的提升图像压缩的效率,同时经过压缩的图像的体积更小,降低了图像的存储成本。
[0004]本专利技术实施例的技术方案是这样实现的:
[0005]本专利技术实施例提供了一种图像压缩方法,所述方法包括:
[0006]对待压缩图像进行编码,得到所述待压缩图像对应的第一隐变量;
[0007]确定所述第一隐变量对应的超先验概率估计值;
[0008]据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述第一隐变量的部分解码结果;
[0009]根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;
[0010]利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,其中,所述压缩后图像的体积小于所述待压缩图像。
[0011]本专利技术实施例还提供了一种图像生成装置,所述装置包括:
[0012]信息传输模,用于对待压缩图像进行编码,得到所述待压缩图像对应的第一隐变量;
[0013]信息传处理,用于确定所述第一隐变量对应的超先验概率估计值;
[0014]所述信息传处理,用于据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述第一隐变量的部分解码结果;
[0015]所述信息传处理,用于根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;
[0016]所述信息传处理,用于利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,其中,所述压缩后图像的体积小于所述待压缩图像。
[0017]上述方案中,
[0018]所述信息处理模块,用于对所述第一隐变量进行编码,得到第三隐变量;
[0019]所述信息处理模块,用于对所述第三隐变量进行熵编码处理,得到所述第三隐变量的熵编码;
[0020]所述信息处理模块,用于对所述第三隐变量的熵编码进行解码处理,得到第四隐变量;
[0021]所述信息处理模块,用于对所述第四隐变量进行解码处理,得到所述超先验概率估计值。
[0022]上述方案中,
[0023]所述信息处理模块,用于对所述第二隐变量进行分组,得到至少两组子隐变量;
[0024]所述信息处理模块,用于通过棋盘格自回归对每一组子隐变量进行处理;
[0025]所述信息处理模块,用于当每一组子隐变量完成空间自回归后,通过所述部分解码结果预测未解码的通道组,直至所述第二隐变量完全完成自回归处理,得到所述第二隐变量的均值和方差。
[0026]上述方案中,
[0027]所述信息处理模块,用于利用所述均值和所述方差对所述第二隐变量进行解码,得到所述第二隐变量的解码结果;
[0028]所述信息处理模块,用于对所述第二隐变量的解码结果交替进行分割和注意力机制转移处理,直至所述第二隐变量的解码结果完全分割,得到所述压缩后图像。
[0029]上述方案中,所述方法基于图像处理模型所实现,所述图像处理模型包括:图像变换网络、超先验网络和上下文网络,
[0030]所述信息处理模块,用于通过图像处理模型的图像变换网络对待压缩图像进行编码,得到第一隐变量;
[0031]通过所述超先验网络,根据所述第一隐变量确定所述超先验概率估计值;
[0032]通过所述上下文网络根据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述部分解码结果;
[0033]通过所述上下文网络,根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;
[0034]通过所述图像变换网络利用所述均值和所述方差对所述第二隐变量进行解码,得到所述压缩后图像。
[0035]上述方案中,
[0036]所述信息处理模块,用于获取与所述图像处理模型对应的第一训练样本集合,其中所述第一训练样本集合包括至少一组无噪声的训练样本;
[0037]所述信息处理模块,用于为所述第一训练样本集合配置随机噪声,以形成相应的第二训练样本集合;
[0038]所述信息处理模块,用于通过所述图像处理模型对所述第一训练样本集合和所述第二训练样本集合进行处理,得到所述图像处理模型的初始参数;
[0039]所述信息处理模块,用于基于所述图像处理模型的初始参数和所述图像处理模型的损失函数,通过所述第一训练样本集合和所述第二训练样本集合,对所述图像处理模型进行训练,确定所述图像处理模型的图像变换网络参数、超先验网络参数和上下文网络参
数。
[0040]上述方案中,
[0041]所述信息处理模块,用于当所述图像处理模型的使用环境为视频图像压缩时,确定与所述图像处理模型的使用环境相匹配的动态噪声数量阈值;
[0042]所述信息处理模块,用于根据所述动态噪声数量阈值,为所述第一训练样本配置动态数量的随机噪声,以形成与所述动态噪声阈值相匹配的第二训练样本集合。
[0043]上述方案中,
[0044]所述信息处理模块,用于当所述图像处理模型的使用环境为医疗图像压缩时,确定与所述图像处理模型的使用环境相匹配的固定噪声数量阈值;
[0045]所述信息处理模块,用于根据所述固定噪声数量阈值,为所述第一训练样本配置固定数量的随机噪声,以形成与所述固定噪声阈值相匹配的第二训练样本集合。
[0046]本专利技术实施例还提供了一种图像处理装置,其特征在于,所述训练装置包括:
[0047]存储器,用于存储可执行指令;
[0048]处理器,用于运行所述存储器存储的可执行指令时,实现前序的图像处理方法。
[0049]本专利技术实施例还提供了一种计算机程序产品,所述计算机程序或指令被处理器执行时,实现前序的图像处理方法。
[0050]本专利技术实施例还提供了一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现前序的图像处理方法。
[0051]本专利技术实施例具有以下有益效果:
[0052]1)本专利技术实施例通过图像处理模型的图像变换网络对待压缩图像进行编码,得到第一隐变量,所述超先验网络根据所述第一隐变量确定超先验概率估计值;由此,利用转移窗口注意力本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像压缩方法,其特征在于,所述方法包括:对待压缩图像进行编码,得到所述待压缩图像对应的第一隐变量;确定所述第一隐变量对应的超先验概率估计值;根据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述第一隐变量的部分解码结果;对所述第一隐变量进行量化处理,得到第二隐变量;根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,其中,所述压缩后图像的体积小于所述待压缩图像。2.根据权利要求1所述的方法,其特征在于,所述确定所述第一隐变量对应的超先验概率估计值,包括:对所述第一隐变量进行编码,得到第三隐变量;对所述第三隐变量进行熵编码处理,得到所述第三隐变量的熵编码;对所述第三隐变量的熵编码进行解码处理,得到第四隐变量;对所述第四隐变量进行解码处理,得到所述超先验概率估计值。3.根据权利要求1所述的方法,其特征在于,所述根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差,包括:对所述第二隐变量进行分组,得到至少两组子隐变量;通过棋盘格自回归对每一组子隐变量进行处理;当每一组子隐变量完成空间自回归后,通过所述部分解码结果预测未解码的通道组,直至所述第二隐变量完全完成自回归处理,得到所述第二隐变量的均值和方差。4.根据权利要求1所述的方法,其特征在于,所述利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,包括:利用所述均值和所述方差对所述第二隐变量进行解码,得到所述第二隐变量的解码结果;对所述第二隐变量的解码结果交替进行分割和注意力机制转移处理,直至所述第二隐变量的解码结果完全分割,得到所述压缩后图像。5.根据权利要求1所述的方法,其特征在于,所述方法基于图像处理模型所实现,所述图像处理模型包括:图像变换网络、超先验网络和上下文网络,所述对待压缩图像进行编码,得到所述待压缩图像对应的第一隐变量,包括:通过图像处理模型的图像变换网络对待压缩图像进行编码,得到第一隐变量;所述确定所述第一隐变量对应的超先验概率估计值,包括:通过所述超先验网络,根据所述第一隐变量确定所述超先验概率估计值;所述根据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述第一隐变量的部分解码结果,包括:通过所述上下文网络根据所述超先验概率估计值,对所述第一隐变量进行部分解码,得到所述部分解码结果;所述根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均
值和方差,包括:通过所述上下文网络,根据所述部分解码结果对所述第二隐变量进行自回归处理,得到第二隐变量的均值和方差;所述利用所述均值和所述方差对所述第二隐变量进行解码,得到压缩后图像,包括:通过所述图像变换网络利用所述均值和所述方差对所述第二隐变量进行解码,得到所述压缩后图像。6.根据权利要求5所述的方法,其特征在于,所述图像变换网络包括:图像编码器网络和图像解码器网络;所述图像编码器网络包括:转移窗口注意力机制模块和块融合模块,其中,所述块融合模块依次包括:空间深度转换层...

【专利技术属性】
技术研发人员:吕悦项进喜张军韩骁
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1