基于深度神经网络的图像降维和重建方法技术

技术编号：23788118 阅读：43 留言：0更新日期：2020-04-15 01:04

本发明专利技术公开了一种基于深度神经网络的图像降维和重建方法，在编码端进行图像降维，减少图片压缩产生的比特流，节约带宽；在解码端进行图像重建。本发明专利技术将离散小波变换与深度学习结合，来提高图像降维和重建性能的潜力。本发明专利技术将变换、量化、熵编码这些模板联合到一起，使得各功能模块之间相互影响，联合优化变换、量化等编码步骤，使得编码器性能尽可能达到最优。本发明专利技术不仅使用神经网络来实现图像的降维和重建，还嵌套使用了离散小波变换。在优化率失真时，为了提供更加精确的码字分布，本发明专利技术结合使用了上下文网络与超先验网络，后者可以纠正前者的预测信息，共同生成更加准确的均值和标准差参数。

Image dimension reduction and reconstruction method based on depth neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于深度神经网络的图像降维和重建方法
本专利技术涉及图像重建领域，具体涉及一种基于深度神经网络的图像降维并重建的方法。
技术介绍
图像是对客观事物的一种相似性、生动的描述，是对客观对象的一种比较直观的表示方式，它包含了被描述对象的有关信息。随着信息时代的发展，图像信息日益增多，而我们的网络带宽有限。在这种情况下，通过将图像降维来实现减少传输图像所占用的带宽就显得尤其重要了。图像数据之所以能被降维，就是因为数据中存在着冗余。图像数据的冗余主要表现为：图像中相邻像素间的相关性引起的空间冗余；图像序列中不同帧之间存在相关性引起的时间冗余；不同频带相关性引起的频谱冗余。图像降维的目的就是通过去除这些数据冗余来减少表示图像所需的比特数。小波变换是研究图像降维和重建的一个热点方向，而本专利技术欲将离散小波变换与深度学习结合，来提高图像降维和重建性能的潜力。
技术实现思路
本专利技术的目的在于提供一种基于深度神经网络的图像降维和重建方法。为实现上述目的，本专利技术设计一种基于深度神经网络的图像降维和重建方法，构建图像降维和重建网络框架，该网络框架包括编码端和解码端；在编码端进行图像降维，减少图片压缩产生的比特流，节约带宽；在解码端进行图像重建；包括以下步骤：S1：在编码端，将待编码的图像输入包含离散小波变换DWT的卷积神经网络，得到保存有结构信息的低分辨率图y；S2：将低分辨率图y量化，得到码字并将所得码字通过熵编码器，得到熵编码后的码流文件；且通过混合高斯模型对...

【技术保护点】
1.基于深度神经网络的图像降维和重建方法，其特征在于，构建图像降维和重建网络框架，该网络框架包括编码端和解码端；在编码端进行图像降维，减少图片压缩产生的比特流，节约带宽；在解码端进行图像重建；包括以下步骤：/nS1：在编码端，将待编码的图像输入包含离散小波变换DWT的卷积神经网络，得到保存有结构信息的低分辨率图y；/nS2：将低分辨率图y量化，得到码字

【技术特征摘要】
1.基于深度神经网络的图像降维和重建方法，其特征在于，构建图像降维和重建网络框架，该网络框架包括编码端和解码端；在编码端进行图像降维，减少图片压缩产生的比特流，节约带宽；在解码端进行图像重建；包括以下步骤：
S1：在编码端，将待编码的图像输入包含离散小波变换DWT的卷积神经网络，得到保存有结构信息的低分辨率图y；
S2：将低分辨率图y量化，得到码字并将所得码字通过熵编码器，得到熵编码后的码流文件；
且通过混合高斯模型对量化后的码字进行概率建模，来控制码率；并引入上下文及超先验信息，让超先验网络基于上下文来学习概率分布的均值与标准差；
S3：在解码端，将压缩解码后的图像输入包含整数小波变换IWT的卷积网络，得到原始图像重构后的图像；该整数小波变换为离散小波变换的逆变换。

2.根据权利要求1所述的基于深度神经网络的图像降维和重建方法，其特征在于，步骤S1包括以下具体步骤：
1.1)将待编码图像的像素值范围规范至[-1.0,1.0]，得到预处理后的图像x；
1.2)对x进行一层卷积操作，提取相关特征信息，得到输出结果x1；
x1＝F(x＊w+b)，其中F为激活函数，以x为输入信息，w为权值，b为偏置，x1为输出结果；
1.3)对x1进行DWT变换，得到输出结果x2；
1.4)对x2进行n次卷积操作，得到x的低分辨率图y。

3.根据权利要求1所述的基于深度神经网络的图像降维和重建方法，其特征在于，步骤S2包括以下具体步骤：
2.1)将低分辨率图像y输入超先验网络，得到输出结果φ；
2.2)对y进行四舍五入的量化，得到

其中U(-0.5,0.5)为值域[-0.5,0.5]的均匀分布；
2.3)将输入上下文网络，得到输出结果θ；
该上下文网络在生成某点像素值得时候，将该像素右侧和下侧的像素值掩盖，只通过上侧和左侧的像素值来计算当前点的像素值；
2.4)将φ和θ同时输入熵编码器的参数估计网络，进行多层卷积操作，得到混合高斯分布的参数，即均值μ与标准差δ；
2.5)熵编码器根据μ、δ对进行编...

【专利技术属性】
技术研发人员：侯兴松，康越，
申请(专利权)人：苏州天必佑科技有限公司，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人