一种基于Swin-Transformer和自回归的图像压缩方法和系统技术方案

技术编号：36786662 阅读：11 留言：0更新日期：2023-03-08 22:30

本发明专利技术公开一种基于Swin

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Swin
‑
Transformer和自回归的图像压缩方法和系统

[0001]本专利技术涉及基于深度学习的图像压缩
，特别涉及基于Swin
‑ꢀ
Transformer和自回归的图像压缩方法和系统。

技术介绍

[0002]随着互联网技术的快速发展，以及信息化时代的到来，人们获取信息的方式日益丰富，特别是现在智能设备的普及，越来越多的信息需要在这些设备上进行传递有数据表明，人们通过视觉从外界获取信息占比很高，而图像作为视觉信息表示的主要方式，通过对客观事物的直观表达，以形象化、生动化的形式向人们传递着事物本身的信息。所以图像成为了人们生活中获取信息最重要途径之一。在利用图像进行信息传递时，由于原始图像内部存在大量冗余，在信息传递的过程中会占用较多的网络资源和存储空间。因此，原始图像没有经过压缩处理，在一定程度上限制了信息的存储和传输。所以，对原始图像进行压缩，进而缓解互联网的传输及储存压力，能够使人们更快捷、方便的接收信息。近年来，越来越多的领域需要用图像来传递信息，数字化图像数据为信息传递带来便利的同时，也对计算机存储资源和网络传输带宽提出了挑战。图片未经压缩与经过压缩后的对比，人眼视觉效果相差无几，但是图像所占内存却相差几十倍若是将海量的原始图像进行存储，以目前的硬件存储技术，必然会增加存储器的压力。因此，未经过压缩的图像，极大的增加了日常网络传输和数据存储的负担，所以，如何研究高效、合适的图像压缩方法，通过去除图像中的多余数据，进而降低图像的存储空间，并提高图像在网络...

【技术保护点】

【技术特征摘要】
1.一种基于Swin
‑
Transformer和自回归的图像压缩方法，其特征包括以下步骤：S1、收集自然环境中多种不同图片，将收集的图片，随机按照9：1的比例分成两部分，前一部分构成训练集，后一部分构成测试集。并且对训练集进行预处理；S2、构建图像压缩神经网络；将S1得到的图片随机水平翻转、随机裁剪和归一化后输入到构建的图像压缩神经网络中进行训练；损失函数使用均方误差、感知损失和率失真损失函数，设置超参数平衡损失权重，设置优化策略用于构建图像压缩网络，通过对网络进行循环迭代训练使损失函数不断减小，直到完成设定的迭代次数并将训练权重参数保存；S3、利用步骤S2构建的图像压缩神经网络和获得的网络训练权重参数构建基于Swin
‑
Transformer和自回归的图像压缩系统，并使用该压缩系统对图像进行压缩，并存储起来。需要使用图像时，使用本图像压缩系统将所需要的图像的压缩文件进行解压，从而获得所需的图片。2.根据权利要求1所述的一种基于Swin
‑
Transformer和自回归的图像压缩方法，其特征在于，包括如下步骤：S21、使用Swin
‑
Transformer构建的编码器和重构图片的生成器；S22、采用自回归的方式辅助对编码器Encoder提取的特征进行高斯建模；S23、高斯建模所用到的均值u和方差σ，使用解耦的方式得到；S24、生成器Generator采用卷积神经网络和Swin
‑
Transformer相结合的方式。3.根据权利要求1所述的一种基于Swin
‑
Transformer和自回归的图像压缩方法，其特征在于，步骤S2中所述构建的图像压缩神经网络，具体为：网络结构大体上由三部分组成，分别为编码器Encoder、生成器Generator和Probability Model超先验模型；Encoder依次设置8个Swin
‑
Transformer块(其中每两个Swin
‑
Transformer块下采样一次)和1个算术编码器；Generator则是由算术解码器、9层残差网络堆叠和8个Swin
‑
Transformer堆叠组成，残差网络不对特征进行上采样的操作，而是由8个Swin
‑
Transformer完成上采样的任务，每两个Swin
‑
Transformer块上采样一次；Probability Model主要是由两个部分组成，第一个部分是由算术编码器和Hyper
‑
Encoder组成，其中Hyper

【专利技术属性】
技术研发人员：程吉祥，张宇进，李志丹，
申请(专利权)人：西南石油大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人