一种图像压缩方法及装置制造方法及图纸

技术编号：33910459 阅读：19 留言：0更新日期：2022-06-25 19:22

本发明专利技术提供一种图像压缩方法及装置，所述方法包括：获取待压缩图像；基于预处理规则将所述待压缩图像划分为多个图像块，并将所有所述待压缩图像块输入到预存的目标编码器中，以获取第一隐变量；将所述第一隐变量输入到预存的熵模型中，以获取第二隐变量；将所述第二隐变量输入到预存的目标解码器中，以获取压缩后的图像块，并根据所述压缩后的图像块获取压缩后的图像；本发明专利技术所述方法在图像压缩任务中引入Transformer模块并采用对称处理架构进行图像的编码和解码，提高了图像压缩效率。提高了图像压缩效率。提高了图像压缩效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像压缩方法及装置

[0001]本专利技术属于计算机视觉领域，尤其涉及一种图像压缩方法及装置。

技术介绍

[0002]图像压缩是数据压缩技术在数字图像上的应用，图像压缩目的是减少图像数据中的冗余信息，从而高效地存储和传输数据，即在给定比特率或者压缩比下得到最好的图像质量。
[0003]现有技术通常基于卷积神经网络来设计解码器和编码器来执行图像压缩任务，但基于卷积神经网络的图像压缩过程无法捕获图像的语义信息，而利用图像的空间冗余信息又使得基于全局的注意力机制在图像压缩任务中表现较差，导致图像压缩效率较低。

技术实现思路

[0004]本专利技术提供的一种图像压缩方法及装置，用以解决现有技术基于卷积神经网络来设计解码器和编码器来执行图像压缩任务时因无法捕获图像的语义信息导致图像压缩时的率失真性能较差的缺陷，提升了图像的压缩效率。
[0005]本专利技术提供一种图像压缩方法，所述方法包括：
[0006]获取待压缩图像；基于预处理规则将所述待压缩图像划分为多个图像块，并将所有所述待压缩图像块输入到预存的目标编码器中，以获取第一隐变量，其中，所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块；将所述第一隐变量输入到预存的熵模型中，以获取第二隐变量；将所述第二隐变量输入到预存的目标解码器中，以获取压缩后的图像块，并根据所述压缩后的图像块获取压缩后的图像，其中，所述目标解码器包括去嵌入层模块、所述Transformer模块以及块分裂模块。
[0007]根据本...

【技术保护点】

【技术特征摘要】
1.一种图像压缩方法，其特征在于，包括：获取待压缩图像；基于预处理规则将所述待压缩图像划分为多个图像块，并将所有所述待压缩图像块输入到预存的目标编码器中，以获取第一隐变量，其中，所述目标编码器包括线性嵌入层模块、Transformer模块以及块合并模块；将所述第一隐变量输入到预存的熵模型中，以获取第二隐变量；将所述第二隐变量输入到预存的目标解码器中，以获取压缩后的图像块，并根据所述压缩后的图像块获取压缩后的图像，其中，所述目标解码器包括去嵌入层模块、所述Transformer模块以及块分裂模块。2.根据权利要求1所述的图像压缩方法，其特征在于，将所述第一隐变量输入到预存的熵模型中，以获取第二隐变量，具体包括：将所述第一隐变量输入到所述熵模型中，获取所述第一隐变量中每个元素的均值和方差，并根据所述每个元素的均值和方差模拟所述第一隐变量的正态分布，以获取概率分布函数；基于所述概率分布函数将所述第一隐变量进行算术编码，以获取目标比特流；基于所述概率分布函数将所述目标比特流进行算术解码，以获取第三隐变量；通过所述熵模型获取所述第三隐变量的量化残差损失，并基于所述第三隐变量和所述量化残差损失获取所述第二隐变量。3.根据权利要求1所述的图像压缩方法，其特征在于，根据所述压缩后的图像块获取压缩后的图像，之后包括：利用以下公式计算全局损失L：L＝R+λD其中，λ为超参数，R为压缩得到的比特流大小，D为失真项；根据所述全局损失获取目标图像压缩模型。4.根据权利要求3所述的图像压缩方法，其特征在于，根据所述全局损失获取目标图像压缩模型包括：基于BP算法训练图像压缩...

【专利技术属性】
技术研发人员：张兆翔，宋纯锋，邹仁杰，
申请(专利权)人：中国科学院自动化研究所，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人