基于八度卷积和语义分割的图像压缩方法及系统技术方案

技术编号：28322949 阅读：33 留言：0更新日期：2021-05-04 13:03

本公开提供了一种基于八度卷积和语义分割的图像压缩方法及系统，所述方案包括：利用预训练的语义分割网络生成原始图像的语义分割图；将所述语义分割图和原始图像作为第一组八度卷积网络的输入，生成图像的压缩表示；对所述压缩表示进行上采样，并将其与所述语义分割图作为第二组八度卷积网络的输入，得到原始图像估计值；计算原始图像与所述原始图像估计值间的残差，并对所述残差进行有损编码，将原始图像估计值与解码后的残差图像相加，得到最终的重建图像。通过将语义分割图的输入可以指导图像空间上的比特流的分配，利用八度卷积网络针对图像空间中的高频信息和低频信息进行单独优化，在保证压缩率的同时，可以有效合成高质量、高细节的图像。

全部详细技术资料下载

【技术实现步骤摘要】
基于八度卷积和语义分割的图像压缩方法及系统
本公开涉及计算机视觉
，特别是涉及基于八度卷积和语义分割的图像压缩方法及系统。
技术介绍
本部分的陈述仅仅是提到了与本公开相关的
技术介绍
，并不必然构成现有技术。随着信息技术突飞猛进的发展，互联网上出现越来越多的多媒体数据，高质量的多媒体内容开始大量普及。如何对这些数据进行处理来提高传输效率以及降低存储成本成为了一个极为重要的问题。对于图像方面，大量的图像产生巨大数据量给存储和传输都带来极大的挑战，合理的进行图像压缩有利于减小存储压力，提高传输能力，图像压缩技术受到了越来越多的关注。图像之所以能够进行压缩是因为存在很大的数据冗余，图像的冗余主要包含空间冗余、频率冗余、信息熵冗余等。图像压缩的目的就是去尽量减小这些冗余。图像压缩技术包含有损图像压缩和无损图像压缩技术。无损压缩技术就是运用适当的编码技术，使得像素之间的联系被几乎完整的保留下来，所以图像更精确，但这样以来压缩比率比较小，占用空间较大。由于人的肉眼具有视觉上的冗余，对于一些极细的信息感知不敏感，人眼允许图像编码上可以有一定的失真，这使得有损图像压缩的运用成为可能，对于一些不需要很高精确度或者压缩后不影响表达内容的图像，在保证观感质量的同时，可以使用有损图像压缩技术，能够进一步的减小存储资源的占用。专利技术人发现，传统的有损图像压缩系统通常由编码器、量化器和解编码器组成，编码器对图像进行编码，量化器通过对数据进行量化来减小存储空间，然后进行熵编码来进一步的压缩数据，最后通过反量化，进入解码...

【技术保护点】
1.一种基于八度卷积和语义分割的图像压缩方法，其特征在于，包括：/n利用预训练的语义分割网络生成原始图像的语义分割图，并对其进行无损编码；/n将所述语义分割图和原始图像作为第一组八度卷积网络的输入，生成图像的压缩表示，并对其进行无损编码；对所述压缩表示进行上采样，并将其与所述语义分割图作为第二组八度卷积网络的输入，得到原始图像估计值；/n计算原始图像与所述原始图像估计值间的残差，并对所述残差进行有损编码，将原始图像估计值与解码后的残差图像相加，得到最终的重建图像。/n

【技术特征摘要】
1.一种基于八度卷积和语义分割的图像压缩方法，其特征在于，包括：
利用预训练的语义分割网络生成原始图像的语义分割图，并对其进行无损编码；
将所述语义分割图和原始图像作为第一组八度卷积网络的输入，生成图像的压缩表示，并对其进行无损编码；对所述压缩表示进行上采样，并将其与所述语义分割图作为第二组八度卷积网络的输入，得到原始图像估计值；
计算原始图像与所述原始图像估计值间的残差，并对所述残差进行有损编码，将原始图像估计值与解码后的残差图像相加，得到最终的重建图像。

2.如权利要求1所述的一种基于八度卷积和语义分割的图像压缩方法，其特征在于，所述语义分割网络采用SegNet网络，原始图像通过预训练的SegNet输出语义分割图，将其编码为比特流的底层，然后使其与原始图像共同作为ComNet输入，以生成原始图像的低维表示。

3.如权利要求2所述的一种基于八度卷积和语义分割的图像压缩方法，其特征在于，所述语义分割图和原始图像的低维表示均使用FLIF进行无损编码。

4.如权利要求1所述的一种基于八度卷积和语义分割的图像压缩方法，其特征在于，所述第一组八度卷积网络采用ComNet网络，所述ComNet网络具有三层八度卷积，每一层八度卷积对原始图像进行一次下采样，分别生成128、256、512通道的特征图。

5.如权利要求4所述的一种基于八度卷积和语义分割的图像压缩方法，其特征在于，所述八度卷积层的结构包括：四个卷积核分别对应两个不同频率的分量的计算：XH→YH，XH→YL，XL→YH，XL→YL，其中XH→YL过程为了使低频维度减半，采用步长为2的平均池化，而XL→YH中为了使维度增加，先进行基于最临近插值法进行上采样，在进行卷积操作。

6.如权利要求1所述的一种基于八度卷积和语义分割的图像压缩方法，其...

【专利技术属性】
技术研发人员：孟丽丽，刘志远，蔡晓雅，张佳，谭艳艳，张化祥，
申请(专利权)人：山东师范大学，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人