一种图像压缩方法、装置、电子设备及存储介质制造方法及图纸

技术编号：35459390 阅读：14 留言：0更新日期：2022-11-03 12:24

本申请涉及图像处理技术领域，尤其涉及一种图像压缩方法、装置、电子设备及存储介质。本申请先将获取到的原始图像进行切割得到多个区域图像，并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量，进而，通过将原始图像以及原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器，得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。本申请通过空域自适应压缩自编码器对原始图像的各个区域图像分别按照各自适配的特征通道数进行图像压缩，可以在保证解压缩后的目标重建图像满足一定质量前提下，显著提升图像压缩过程中的计算效率，可以同时兼顾失真度和编码开销的联合优化。合优化。合优化。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像压缩方法、装置、电子设备及存储介质

[0001]本申请涉及图像处理
，尤其涉及一种图像压缩方法、装置、电子设备及存储介质。

技术介绍

[0002]近年来，随着数字化信息时代的到来和多媒体计算机技术的发展，使得人们所面对的各种数据量剧增，数据压缩技术的研究受到人们越来越多的重视。图像压缩就是在满足一定保真度和图像质量的前提下，对图像数据进行变换、编码和压缩，去除冗余的数据以减少标识数字图像时需要的数据量，便于图像的存储和传输。
[0003]目前，图像压缩方法主要包括传统图像压缩方法和深度学习图像压缩方法。其中，传统图像压缩方法一般采用变换编码技术、或是联合使用了预测编码技术和变换编码技术的混合编码框架来实现对图像的压缩。深度学习图像压缩方法则是对全分辨率的输入图像进行非线性变换，从而完成整个图像压缩过程。
[0004]但是，上述图像压缩方法一般只考虑对于压缩问题通用的失真率的优化，或只考虑在编码过程中对于编码开销的优化，不能同时兼顾失真度和编码开销的联合优化，造成计算资源和时间的浪费，或者压缩效果的损失。

技术实现思路

[0005]有鉴于此，本申请实施例至少提供一种图像压缩方法、装置、电子设备及存储介质，可以在保证解压缩后的目标重建图像满足一定质量前提下，显著提升图像压缩过程中的计算效率，可以同时兼顾失真度和编码开销的联合优化。
[0006]本申请主要包括以下几个方面：
[0007]第一方面，本申请实施例提供一种图像压缩方法，所述图像压缩方法包括：获取待压缩...

【技术保护点】

【技术特征摘要】
1.一种图像压缩方法，其特征在于，所述图像压缩方法包括：获取待压缩的原始图像；将所述原始图像进行切割得到多个区域图像，并分别确定各个区域图像在图像压缩过程中所需的有效通道的通道数量；将所述原始图像以及所述原始图像的各个区域图像分别对应的通道数量输入训练好的空域自适应压缩自编码器，得到所述原始图像经由神经网络变换后的目标潜在表示和目标重建图像。2.根据权利要求1所述的图像压缩方法，其特征在于，针对所述原始图像的任一所述区域图像；根据以下步骤确定所述区域图像对应的通道数量：将所述区域图像输入训练好的第一神经网络模型中的第一骨干网络，确定所述区域图像对应的图像特征信息；将所述区域图像对应的图像特征信息输入所述第一神经网络模型中的第一路由决策网络，确定所述区域图像对应的通道数量；其中，所述第一神经网络模型是依赖第二神经网络模型进行训练得到的，所述第一神经网络模型的网络规模小于所述第二神经网络模型的网络规模。3.根据权利要求2所述的图像压缩方法，其特征在于，根据以下步骤训练出所述第一神经网络模型：获取多个样本图像，并确定每个样本图像进行切割得到各个样本区域图像分别对应的真实通道数量；针对任一所述样本区域图像，将所述样本区域图像输入训练好的所述第二神经网络模型确定出所述样本区域图像的第一预测通道数量，以及将所述样本区域图像输入小型初始神经网络模型确定出所述样本区域图像的第二预测通道数量；根据所述样本区域图像的真实通道数量与第二预测通道数量之间的第一熵损，以及所述样本区域图像的第一预测通道数量与第二预测通道数量之间的第二熵损，确定所述样本区域图像对应的第一联合熵损；基于所述多个样本图像的各个样本区域图像对应的第一联合熵损，对所述小型初始神经网络模型的模型参数进行调整，直至满足第一预设训练截止条件，停止对所述小型初始神经网络模型的训练，生成所述第一神经网络模型。4.根据权利要求2所述的图像压缩方法，其特征在于，根据以下步骤训练出所述第二神经网络模型：获取多个样本图像，并确定每个样本图像进行切割得到各个样本区域图像分别对应的真实通道数量以及真实降级失真代价值；针对任一所述样本区域图像，将所述样本区域图像输入大型初始神经网络模型，确定所述样本区域图像的第三预测通道数量以及预测降级失真代价值；根据所述样本区域图像的真实通道数量与第三预测通道数量之间的第三熵损，以及所述样本区域图像的预测降级失真代价值与真实降级失真代价值之间的第四熵损，确定所述样本区域图像的第二联合熵损；基于所述多个样本图像的各个样本区域图像对应的第二联合熵损，对所述大型初始神经网络模型的模型参数进行调整，直至满足第二预设训练截止条件，停止对所述大型初始
神经网络模型的训练，生成所述第二神经网络模型。5.根据权利要求3或4所述的图像压缩方法，其特征在于，根据以下步骤确定所述样本区域图像的真实通道数量：将所述样本区域图像以及多个预设通道数...

【专利技术属性】
技术研发人员：高伟，陶履方，李革，
申请(专利权)人：北京大学深圳研究生院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人