一种图像压缩方法、图像解码方法、智能终端及存储介质技术

技术编号:29843547 阅读:15 留言:0更新日期:2021-08-27 14:34
本发明专利技术公开了一种图像压缩方法、图像解码方法、智能终端及存储介质,获取目标图像,将所述目标图像进行编码处理,以获取多个特征图;将多个所述特征图进行聚类量化处理,得到量化后的特征图数据;将所述特征图数据通过概率估计网络进行概率估计和算术编码进行转化得到二进制数据,所述二进制数据为所述目标图像的图像压缩数据;获取所述二进制数据;将所述二进制数据通过概率估计网络和算术解码得到聚类量化后的多个特征图,输出所述目标图像对应的重构后的解码图像。本发明专利技术通过联合多尺度自编码网络与概率估计网络同步优化进行图像压缩和解码,概率估计网络能更好的对有损模型压缩的数据进行概率估计,达到更好的图像处理效果。

【技术实现步骤摘要】
一种图像压缩方法、图像解码方法、智能终端及存储介质
本专利技术涉及图像处理
,尤其涉及一种图像压缩方法、图像解码方法、智能终端及存储介质。
技术介绍
深度卷积自编码网络的图像压缩模型通过卷积自编码网络学习图像数据的数据分布,因为图像是符合高斯分布的,所以通过参数学习,图像压缩模型可以拟合图像信息的分布,而且整个图像压缩模型是端到端可学习的。基于深度卷积自编码网络的图像压缩模型,因卷积网络具有很好的图像抽象特征的表征能力而被广泛使用,但为了让图像压缩模型可以更好的压缩特征数据,通常都会使用熵编码(熵编码是编码过程中按熵原理不丢失任何信息的编码方法)对图像压缩模型的数据进一步压缩,只是熵编码是无损压缩,即熵编码过程不会有信息损失。目前,多尺度图像压缩方法中有损压缩(多尺度压缩模型)与熵编码中的概率估计网络(概率估计网络是一个用于学习和估计图像量化后特征图的每一个像素值出现概率的网络模型,因为熵编码是需要待编码目标的概率值)需要各自独立训练优化,即先训练优化多尺度模型,待多尺度压缩模型训练之后,固定多尺度压缩模型来训练优化概率估计网络,而当多尺度压缩模型和概率估计网络联合优化时会出现解码图像异常或者压缩的文件大小翻倍的问题(因为原来的定值量化导致多尺度压缩模型与概率估计网络在联合训练时无法沿着各自正确的方向学习各自模型的参数)。因此,现有技术还有待于改进和发展。
技术实现思路
本专利技术的主要目的在于提供一种图像压缩方法、图像解码方法、智能终端及存储介质,旨在解决现有技术中多尺度压缩模型和概率估计网络联合优化时会出现解码图像异常或者压缩的文件大小翻倍的问题。为实现上述目的,本专利技术提供一种图像压缩方法,包括如下步骤:获取目标图像,将所述目标图像进行编码处理,以获取多个特征图;将多个所述特征图进行聚类量化处理,得到量化后的特征图数据;将所述特征图数据通过概率估计网络进行概率估计和算术编码进行转化得到二进制数据,所述二进制数据为所述目标图像的图像压缩数据。可选地,所述的图像压缩方法,其中,所述获取多个特征图,具体为:将所述目标图像依次进行预设倍数的下采样操作、卷积操作、归一化与非线性变换以及通道分割操作,以获取四个特征图。可选地,所述的图像压缩方法,其中,所述将所述目标图像依次进行预设倍数的下采样操作、卷积操作、归一化与非线性变换以及通道分割操作,以获取四个特征图,具体包括:将所述目标图像依次进行预设倍数下采样操作、第一卷积操作、归一化与非线性变换以及第二卷积操作;将经过所述第二卷积操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第三卷积操作以及第一通道分割操作,输出第一特征图;将经过所述第一通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第四卷积操作以及第二通道分割操作,输出第二特征图;将经过所述第二通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第五卷积操作以及第三通道分割操作,输出第三特征图;将经过所述第三通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换以及第六卷积操作,输出第四特征图。可选地,所述的图像压缩方法,其中,所述将经过所述第三通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换以及第六卷积操作,输出第四特征图,之后还包括:将所述第一特征图、所述第二特征图和所述第三特征图分别经过第一预设倍数下采样操作、第二预设倍数下采样操作和第三预设倍数下采样操作,以控制所述第一特征图、所述第二特征图和所述第三特征图的尺度与所述第四特征图相同,并与所述第四特征图在通道维度进行合并。可选地,所述的图像压缩方法,其中,所述预设倍数下采样操作为2倍下采样操作,所述2倍下采样操作用于将图像的尺寸缩小一半;所述第一卷积操作中的卷积核大小为3*3,输出通道数量为128,步长为1,像素填充为1;所述第二卷积操作中的卷积核大小为3*3,输出通道数量为64,步长为1,像素填充为1;所述第三卷积操作中的卷积核大小为3*3,输出通道数量为128+第一特征图的通道数量,步长为1,像素填充为1;所述第四卷积操作中的卷积核大小为3*3,输出通道数量为256+第二特征图的通道数量,步长为1,像素填充为1;所述第五卷积操作中的卷积核大小为3*3,输出通道数量为512+第三特征图的通道数量,步长为1,像素填充为1;所述第六卷积操作中的卷积核大小为3*3,输出通道数量为第四特征图的通道数量,步长为1,像素填充为1。可选地,所述的图像压缩方法,其中,所述第一通道分割操作用于将通道数量为128+第一特征图的通道数量个通道的张量分割为通道数量为128和第一特征图的通道数量的两个张量;所述第二通道分割操作用于将通道数量为256+第二特征图的通道数量个通道的张量分割为通道数量为256和第二特征图的通道数量的两个张量;所述第三通道分割操作用于将通道数量512+第三特征图的通道数量个通道的张量分割为通道数量为512和第三特征图的通道数量的两个张量。可选地,所述的图像压缩方法,其中,所述将多个所述特征图进行聚类量化处理,具体包括:获取多个所述特征图;给定聚类量化中心点C={c1,c2,...,cL},计算输入input_x中每个点与量化中心点的距离,将距离最近的中心点设为其量化的值,即Q(input_xi):=argminj(input_xi-cj),i表示输入input_x的第i个数据,j表示量化的第j个中心,j∈[1,L],L是聚类量化中心点的数量;在训练时进行软量化处理,其处理方式为其中,σ是超参数;软量化过度到硬量化并取整,stop_gradient(Q(input_xi)-soft_Q(input_xi))+soft_Q(input_xi);取整round(x),输出量化后的特征图数据。另外,为实现上述目的,本专利技术提供一种图像解码方法,包括如下步骤:获取二进制数据,所述二进制数据为目标图像的图像压缩数据;将所述二进制数据通过概率估计网络和算术解码得到聚类量化后的多个特征图,输出所述目标图像对应的重构后的解码图像。可选地,所述的图像解码方法,其中,所述多个特征图包括:第一特征图、第二特征图、第三特征图和第四特征图。可选地,所述的图像解码方法,其中,所述将所述二进制数据通过概率估计网络和算术解码得到聚类量化后的多个特征图,输出重构的解码图像,具体包括:将所述第四特征图依次进行第七卷积操作、归一化与非线性变换以及第一次预设倍数上采样操作;将经过第一次预设倍数上采样操作后的图像和所述第三特征图依次进行第一通道合并操作、第八卷积操作、归一化与非线性变换以及第二次预设倍数上采样操作;将经过第二次预设倍数上采样操作后的图像和所述第二特征图依次进行第二通道合并操作、第九卷积操作、归一化与非线性变本文档来自技高网...

【技术保护点】
1.一种图像压缩方法,其特征在于,所述图像压缩方法包括如下步骤:/n获取目标图像,将所述目标图像进行编码处理,以获取多个特征图;/n将多个所述特征图进行聚类量化处理,得到量化后的特征图数据;/n将所述特征图数据通过概率估计网络进行概率估计和算术编码进行转化得到二进制数据,所述二进制数据为所述目标图像的图像压缩数据。/n

【技术特征摘要】
1.一种图像压缩方法,其特征在于,所述图像压缩方法包括如下步骤:
获取目标图像,将所述目标图像进行编码处理,以获取多个特征图;
将多个所述特征图进行聚类量化处理,得到量化后的特征图数据;
将所述特征图数据通过概率估计网络进行概率估计和算术编码进行转化得到二进制数据,所述二进制数据为所述目标图像的图像压缩数据。


2.根据权利要求1所述的图像压缩方法,其特征在于,所述获取多个特征图,具体为:
将所述目标图像依次进行预设倍数的下采样操作、卷积操作、归一化与非线性变换以及通道分割操作,以获取四个特征图。


3.根据权利要求2所述的图像压缩方法,其特征在于,所述将所述目标图像依次进行预设倍数的下采样操作、卷积操作、归一化与非线性变换以及通道分割操作,以获取四个特征图,具体包括:
将所述目标图像依次进行预设倍数下采样操作、第一卷积操作、归一化与非线性变换以及第二卷积操作;
将经过所述第二卷积操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第三卷积操作以及第一通道分割操作,输出第一特征图;
将经过所述第一通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第四卷积操作以及第二通道分割操作,输出第二特征图;
将经过所述第二通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换、第五卷积操作以及第三通道分割操作,输出第三特征图;
将经过所述第三通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换以及第六卷积操作,输出第四特征图。


4.根据权利要求3所述的图像压缩方法,其特征在于,所述将经过所述第三通道分割操作后的图像依次进行预设倍数下采样操作、归一化与非线性变换以及第六卷积操作,输出第四特征图,之后还包括:
将所述第一特征图、所述第二特征图和所述第三特征图分别经过第一预设倍数下采样操作、第二预设倍数下采样操作和第三预设倍数下采样操作,以控制所述第一特征图、所述第二特征图和所述第三特征图的尺度与所述第四特征图相同,并与所述第四特征图在通道维度进行合并。


5.根据权利要求3所述的图像压缩方法,其特征在于,所述预设倍数下采样操作为2倍下采样操作,所述2倍下采样操作用于将图像的尺寸缩小一半;
所述第一卷积操作中的卷积核大小为3*3,输出通道数量为128,步长为1,像素填充为1;
所述第二卷积操作中的卷积核大小为3*3,输出通道数量为64,步长为1,像素填充为1;
所述第三卷积操作中的卷积核大小为3*3,输出通道数量为128+第一特征图的通道数量,步长为1,像素填充为1;
所述第四卷积操作中的卷积核大小为3*3,输出通道数量为256+第二特征图的通道数量,步长为1,像素填充为1;
所述第五卷积操作中的卷积核大小为3*3,输出通道数量为512+第三特征图的通道数量,步长为1,像素填充为1;
所述第六卷积操作中的卷积核大小为3*3,输出通道数量为第四特征图的通道数量,步长为1,像素填充为1。


6.根据权利要求3所述的图像压缩方法,其特征在于,所述第一通道分割操作用于将通道数量为128+第一特征图的通道数量个通道的张量分割为通道数量为128和第一特征图的通道数量的两个张量;
所述第二通道分割操作用于将通道数量为256+第二特征图的通道数量个通道的张量分割为通道数量为256和第二特征图的通道数量的两个张量;
所述第三通道分割操作用于将通道数量512+第三特征图的通道数量个通道的张量分割为通道数量为512和第三特征图的通道数量的两个张量。


7.根据权利要求4所述的图像压缩方法,其特征在于,所述...

【专利技术属性】
技术研发人员:陈巍
申请(专利权)人:武汉TCL集团工业研究院有限公司
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1