基于融合感知损失的深度语义分割图像压缩方法及系统技术方案

技术编号：28423989 阅读：22 留言：0更新日期：2021-05-11 18:32

本公开提供了基于融合感知损失的深度语义分割图像压缩方法及系统，所述方案基于子块以及基于子块的感知损失函数，对压缩网络以及GAN网络进行有效的基于子块的训练，相对于传统的基于原始图像大小的方式可以捕捉更多更微小的图像特征；同时，融合感知损失函数能够较好的平衡每个函数的优缺点，从而获得比传统训练方式更好的训练效果，并且，基于子块的策略还可以在一定程度上抑制振铃效应、色调分离以及区域模糊效应的出现；最后，为了更好的模拟人类复杂的视觉系统，所述方案利用基于视觉感知的评价指标—多尺度结构相似性(MS‑SSIM)，能够较好的保留图像中高频区域的对比度，以及绝对值误差(L1范式)可以保留图像原有色彩和局部结构的特性。

全部详细技术资料下载

【技术实现步骤摘要】
基于融合感知损失的深度语义分割图像压缩方法及系统
本公开涉及计算机视觉
，特别是涉及一种基于融合感知损失的深度语义分割图像压缩方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
，并不必然构成现有技术。图像压缩技术在有限的传输带宽和存储能力的条件下提供高质量图像服务的过程中起着至关重要的作用。而传统的图像压缩技术主要是通过减少图像信息中的冗余(包括空间冗余、视觉冗余以及统计冗余)来减少图像的大小。经典的传统编解码器标准如JPEG、JPEG200以及BPG(HEVC的帧内编码)通常是在编码器和解码器端使用上述压缩技术并且进行单独的优化，这使得在高比率压缩的情况下和一些非线性变换任务中会出现一些明显的压缩伪影如块效应和模糊等现象。而这与人们逐渐上升的对高视觉质量的图像的需求背道相驰。相比之下，深度图像压缩领域则能够以一种更为灵活的方式来学习一种近似图像编解码过程中非线性变化的线性函数，从而进一步提升在高比率压缩中图像的视觉质量。现有技术中，部分研究人员利用GAN提高编码的性能并在解码图像过程中进一步提高图像的视觉质量，与传统的压缩编码比较，基于GAN的图像压缩框架不仅在压缩率方面得到了明显的改善而且还充分利用了现代GPU的并行技术实现了实时的运行。专利技术人发现，虽然基于GAN的深度神经网络在图像压缩领域获得了显著的成效，但是目前它们出现的一些缺点也不容忽视。首先，要训练一个性能表现出色的GAN网络模型，必须要有一些高质量的数据集；其次，基于传统的MSE或者GAN标准损失的...

【技术保护点】
1.基于融合感知损失的深度语义分割图像压缩方法，其特征在于，包括：/n利用预训练的语义分割网络获得原始图像的图像增强语义图，并对其进行无损编码；/n将所述图像增强语义图和原始图像输入全卷积编码器进行压缩编码，生成图像的紧凑表示，作为基础图像描述信息，并对其进行无损编码；/n将上采样的基础图像描述信息及图像增强语义图作为图像残差网络的输入，获得增强重构图像，通过将增强重构图像和原始图像作差，得到重构图像残差信息，并对所述重构图像残差信息进行有损编码；/n将所述图像重构增强信息与所述重构图像残差信息相加，获得重构图像；/n其中，网络的预训练采用融合感知损失函数对所述压缩网络及图像残差网络进行基于子块的训练。/n

【技术特征摘要】
1.基于融合感知损失的深度语义分割图像压缩方法，其特征在于，包括：
利用预训练的语义分割网络获得原始图像的图像增强语义图，并对其进行无损编码；
将所述图像增强语义图和原始图像输入全卷积编码器进行压缩编码，生成图像的紧凑表示，作为基础图像描述信息，并对其进行无损编码；
将上采样的基础图像描述信息及图像增强语义图作为图像残差网络的输入，获得增强重构图像，通过将增强重构图像和原始图像作差，得到重构图像残差信息，并对所述重构图像残差信息进行有损编码；
将所述图像重构增强信息与所述重构图像残差信息相加，获得重构图像；
其中，网络的预训练采用融合感知损失函数对所述压缩网络及图像残差网络进行基于子块的训练。

2.如权利要求1所述的基于融合感知损失的深度语义分割图像压缩方法，其特征在于，所述的图像残差网络，使用图像增强语义图和上采样的基础图像描述信息通过GAN网络中的生成器来拟合图像在压缩过程中损失的图像特征信息，获得增强重构图像，进而通过将增强重构图像和原始图像做差得到重构图像残差信息。

3.如权利要求1所述的基于融合感知损失的深度语义分割图像压缩方法，其特征在于，所述基于子块的训练包括：首先将原始图像分为大小相等的若干个子块，作为网络输入的基本单位；然后使用判别器网络对各个子块进行特征提取，以获得不同范围内的图像分布特征；最后通过融合感知损失与Adam优化器共同对原有GAN网络以及压缩网络进行有效的训练。

4.如权利要求1所述的基于融合感知损失的深度语义分割图像压缩方法，其特征在于，所述基于子块的训练中，使用基于融合感知对抗损失来进行梯度回传，其中GAN网络中使用的基于子块的总体对抗损失可以表示为：
LE＝LDp+LGp
所述GAN网络中判别器的目标则是最大化LDp：

其中，表示判别器网络从第i个子块中在d个尺度(0为原始大小、1为2x大小)下通过网络的第l层网络层提取出的图像的特征信息，这里图像一共分为n个子块。

5.如权利要求1所述的基于融合感知损失的深度语义分割图像压缩方法，其特征在于，所述GAN网络中生成器的目标是最小化GAN标准损失，这里采用了基于子块的融合损失：
LGp＝Lp+L1+L...

【专利技术属性】
技术研发人员：孟丽丽，陈思恩，谭艳艳，张佳，邵秀婷，张化祥，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人