一种图像压缩方法及装置制造方法及图纸

技术编号:33910459 阅读:19 留言:0更新日期:2022-06-25 19:22
本发明专利技术提供一种图像压缩方法及装置,所述方法包括:获取待压缩图像;基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量;将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像;本发明专利技术所述方法在图像压缩任务中引入Transformer模块并采用对称处理架构进行图像的编码和解码,提高了图像压缩效率。提高了图像压缩效率。提高了图像压缩效率。

【技术实现步骤摘要】
一种图像压缩方法及装置


[0001]本专利技术属于计算机视觉领域,尤其涉及一种图像压缩方法及装置。

技术介绍

[0002]图像压缩是数据压缩技术在数字图像上的应用,图像压缩目的是减少图像数据中的冗余信息,从而高效地存储和传输数据,即在给定比特率或者压缩比下得到最好的图像质量。
[0003]现有技术通常基于卷积神经网络来设计解码器和编码器来执行图像压缩任务,但基于卷积神经网络的图像压缩过程无法捕获图像的语义信息,而利用图像的空间冗余信息又使得基于全局的注意力机制在图像压缩任务中表现较差,导致图像压缩效率较低。

技术实现思路

[0004]本专利技术提供的一种图像压缩方法及装置,用以解决现有技术基于卷积神经网络来设计解码器和编码器来执行图像压缩任务时因无法捕获图像的语义信息导致图像压缩时的率失真性能较差的缺陷,提升了图像的压缩效率。
[0005]本专利技术提供一种图像压缩方法,所述方法包括:
[0006]获取待压缩图像;基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量,其中,所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块;将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像,其中,所述目标解码器包括去嵌入层模块、所述Transformer模块以及块分裂模块。
[0007]根据本专利技术提供的一种图像压缩方法,所述方法还包括:
[0008]将所述第一隐变量输入到所述熵模型中,获取所述第一隐变量中每个元素的均值和方差,并根据所述每个元素的均值和方差模拟所述第一隐变量的正态分布,以获取概率分布函数;基于所述概率分布函数将所述第一隐变量进行算术编码,以获取目标比特流;基于所述概率分布函数将所述目标比特流进行算术解码,以获取第三隐变量;通过所述熵模型获取所述第三隐变量的量化残差损失,并基于所述第三隐变量和所述量化残差损失获取所述第二隐变量。
[0009]利用以下公式计算全局损失L:
[0010]L=R+λD
[0011]其中,λ为超参数,R为压缩得到的比特流大小,D为失真项;根据所述全局损失获取目标图像压缩模型。
[0012]基于BP算法训练图像压缩模型,并调整所述比特流大小R和所述失真项D来减小全局损失L,以获取目标超参数;根据所述目标超参数训练所述图像压缩模型,以获取图像压缩模型。
[0013]将所述待压缩图像进行归一化处理,并按照固定划分面积将处理后的图像均分为多个所述图像块。
[0014]所述Transformer模块包括基于窗口的注意力层、多层感知机以及归一化层。
[0015]本专利技术还提供一种图像压缩装置,所述装置包括:
[0016]图像获取模块,用于获取待压缩图像;解码模块,用于基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量;其中,所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块;转换模块,用于将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;解码模块,用于将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像;其中,所述目标解码器包括去嵌入层模块、所述Transformer模块以及块分裂模块。
[0017]本专利技术还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述图像压缩方法的步骤。
[0018]本专利技术还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述图像压缩方法的步骤。
[0019]本专利技术提供的一种图像压缩方法及装置,先获取待压缩图像;然后基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量;再将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;最后将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像;本专利技术所述方法在图像压缩任务中引入Transformer模块并采用对称处理架构进行图像的编码和解码,提高了图像压缩效率。
附图说明
[0020]为了更清楚地说明本专利技术或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0021]图1是本专利技术实施例提供的图像压缩方法的流程示意图;
[0022]图2是本专利技术实施例提供的目标编码器的结构示意图;
[0023]图3是本专利技术实施例提供的目标解码器的结构示意图;
[0024]图4是本专利技术另一实施例提供的获取第二隐变量的流程示意图;
[0025]图5是本专利技术又一实施例提供的Transformer模块的结构示意图;
[0026]图6是本专利技术实施例提供的图像压缩装置的结构示意图;
[0027]图7是本专利技术提供的电子设备的结构示意图。
具体实施方式
[0028]为使本专利技术的目的、技术方案和优点更加清楚,下面将结合本专利技术中的附图,对本专利技术中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,
而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0029]下面结合图1描述本专利技术实施例提供的图像压缩方法,包括:
[0030]步骤101、获取待压缩图像。
[0031]可以理解的是,图像压缩是数据压缩技术在数字图像上的应用,其目的是减少图像数据中的冗余信息从而用更加高效的格式存储和传输数据,当图像数据量过于庞大时,图像信息的存储、传输、处理会变得十分困难,因此,需要对待处理的图像进行图像压缩,使得压缩后的图像能够被有效使用;本实施例从开源数据库中随机抽取100万张RGB彩色图像作为待压缩图像,也可以从其他数据采集平台获取所需的待压缩图像数据。
[0032]步骤102、基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量;其中,所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块。
[0033]可以理解的是,由于需要去除待压缩图像中的冗余信息以获取压缩后的图像,本实施例先利用图像处理软件将获取的待压缩的RGB彩色图像进行归一化处理,统一各图像的尺寸大小;然后将每张图像按照一定的排列顺序划分为多个固定尺寸的图像块,得到图像本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像压缩方法,其特征在于,包括:获取待压缩图像;基于预处理规则将所述待压缩图像划分为多个图像块,并将所有所述待压缩图像块输入到预存的目标编码器中,以获取第一隐变量,其中,所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块;将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量;将所述第二隐变量输入到预存的目标解码器中,以获取压缩后的图像块,并根据所述压缩后的图像块获取压缩后的图像,其中,所述目标解码器包括去嵌入层模块、所述Transformer模块以及块分裂模块。2.根据权利要求1所述的图像压缩方法,其特征在于,将所述第一隐变量输入到预存的熵模型中,以获取第二隐变量,具体包括:将所述第一隐变量输入到所述熵模型中,获取所述第一隐变量中每个元素的均值和方差,并根据所述每个元素的均值和方差模拟所述第一隐变量的正态分布,以获取概率分布函数;基于所述概率分布函数将所述第一隐变量进行算术编码,以获取目标比特流;基于所述概率分布函数将所述目标比特流进行算术解码,以获取第三隐变量;通过所述熵模型获取所述第三隐变量的量化残差损失,并基于所述第三隐变量和所述量化残差损失获取所述第二隐变量。3.根据权利要求1所述的图像压缩方法,其特征在于,根据所述压缩后的图像块获取压缩后的图像,之后包括:利用以下公式计算全局损失L:L=R+λD其中,λ为超参数,R为压缩得到的比特流大小,D为失真项;根据所述全局损失获取目标图像压缩模型。4.根据权利要求3所述的图像压缩方法,其特征在于,根据所述全局损失获取目标图像压缩模型包括:基于BP算法训练图像压缩...

【专利技术属性】
技术研发人员:张兆翔宋纯锋邹仁杰
申请(专利权)人:中国科学院自动化研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1