一种图像主观优化编解码方法技术

技术编号：39402697 阅读：7 留言：0更新日期：2023-11-19 15:54

本发明专利技术公开了一种图像主观优化编解码方法，包括：编码部分：通过卷积网络提取输入的原始图像数据的初级特征；通过第一量化模块对所述初级特征进行变换，得到二级特征；通过超先验概率模型，对所述二级特征进行概率估计，结合拉普拉斯概率模型得到码率估计结果，通过熵编码算法以及拉普拉斯概率，对二级特征进行无损熵编码，得到比特流；解码部分：通过熵解码算法以及拉普拉斯概率，对所述比特流进行解码，获得二级特征，通过反卷积网络对所述二级特征进行非线性变换，获得重建图像。上述方法通过图像主观优化方式，提升重建图像的质量，并且可以提升压缩性能，减少了图像存储空间，减少了不必要的传输费用。了不必要的传输费用。了不必要的传输费用。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像主观优化编解码方法

[0001]本专利技术涉及图像编解码
，尤其涉及一种图像主观优化编解码方法。

技术介绍

[0002]传统的图像编解码中对于图像重构质量对优化大多偏向于客观指标的，例如，使用PSNR(Peak Signal to Noise Ratio，峰值信噪比)，它是一种评价图像的客观标准；但是，客观指标并不能代表人眼真正关注的质量。
[0003]如图1所示，MSE为均方误差，PSNR与MSE成线性关系，在MSE相同的情况下不同成像的质量参差不齐，因此，客观指标并不能直接代表了人眼主观观察下对重建图像质量的评价。
[0004]有鉴于此，有必要引入主观指标来优化图像编解码方案，以提升重建图像的质量。

技术实现思路

[0005]本专利技术的目的是提供一种图像主观优化编解码方法，可以提升重建图像的质量。
[0006]本专利技术的目的是通过以下技术方案实现的：
[0007]一种图像主观优化编解码方法，包括：
[0008]构建图像编解码模型；
[0009]训练所述图像编解码模型：输入原始图像至所述图像编解码模型，获得重建图像与两个码率估计结果，训练包含三个阶段，第一阶段损失包括：重建图像与原始图像的失真，以及两个码率估计结果计算的率损失；第二阶段损失包括：第一阶段损失，以及重建图像与原始图像的VGG网络处理中间层的L1损失；第三阶段损失包括：第二阶段的损失，以及重建图像与原始图像的GAN网络的损失；每一阶段使用相应阶段的损失训练指定次数后进入下...

【技术保护点】

【技术特征摘要】
1.一种图像主观优化编解码方法，其特征在于，包括：构建图像编解码模型；训练所述图像编解码模型：输入原始图像至所述图像编解码模型，获得重建图像与两个码率估计结果，训练包含三个阶段，第一阶段损失包括：重建图像与原始图像的失真，以及两个码率估计结果计算的率损失；第二阶段损失包括：第一阶段损失，以及重建图像与原始图像的VGG网络处理中间层的L1损失；第三阶段损失包括：第二阶段的损失，以及重建图像与原始图像的GAN网络的损失；每一阶段使用相应阶段的损失训练指定次数后进入下一阶段，第三阶段训练完毕后，获得训练后的图像编解码模型；利用训练后的图像编解码模型对输入图像进行编解码，获得重建图像。2.根据权利要求1所述的一种图像主观优化编解码方法，其特征在于，所述图像编解码模型包括：卷积网络、超先验概率模型与反卷积网络；通过训练优化卷积网络、超先验概率模型与反卷积网络中的参数。3.根据权利要求2所述的一种图像主观优化编解码方法，其特征在于，所述卷积网络包括：Space2Depth层、第一残差块、DownResGDNblock、第二残差块、DownResCNblock、第三残差块、DownResGDNblock与第四残差块。4.根据权利要求3所述的一种图像主观优化编解码方法，其特征在于，所述DownResGDNblock包括：三个卷积层、一个LeakyRelu激活层、一个GDN激活层与一个残差链接层；其中，第一个卷积层和第二个卷积层的输入均为第一残差块或者第三残差块的输出，第二个卷积层、LeakyRelu激活层、第三个卷积层、GDN激活层及残差链接层依次连接，并且第一个卷积层还与残差链接层连接；所述DownResCNblock包括：三个卷积层、一个LeakyRelu激活层、一个channelnorm层与一个残差链接层；其中，第一个卷积层和第二个卷积层的输入均为第二残差块的输出，第二个卷积层、LeakyRelu激活层、第三个卷积层、channelnorm层及残差链接层依次连接，并且第一个卷积层还与残差链接层连接。5.根据权利要求2所述的一种图像主观优化编解码方法，其特征在于，所述反卷积网络包括依次设置的ShortResblock层、第五残差块、UpResGDNblock、第六残差块、UpResCNblock、第七残差块、UpResGDNblock、第八残差块与Depth2Space层；其中，所述ShortResblock层包含依次设置的多个ShortResblock。6.根据权利要求5所述的一种图像主观优化编解码方法，其特征在于，所述UpResGDNblock包括：两个反卷积层、一个卷积层、一个LeakyRelu激活层、一个iGDN激活层与一个残差链接层；其中，第一个反卷积层与iGDN激活层的输入均为第五残差块或者第七残差块的输出，iGDN激活层、第二个反卷积层、LeakyRelu激活层、卷积层与残差链接层依次连接，并且第一个反卷积层还与残差链接层连接；所述UpResCNblock包括：两个反卷积层、一个卷积层、一个LeakyRelu激活层、一个iGDN激活层与一个残差链接层；其中，第一个反卷积层与iGDN激活层的输入均为第六残差块的输出，iGDN激活层、第二个反卷积层、LeakyRelu激活层、卷积层与残差链接层依次连接，并且第一个反卷积层还与残差链接层连接；所述ShortResblock包括：两个LeakyRelu激活层、两个卷积层与一个残差链接层；其中，第一个LeakyRelu激活层、第...

【专利技术属性】
技术研发人员：张子文，武祥吉，陈也达，袁庆祝，冯溢，
申请(专利权)人：上海双深信息技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人