一种基于卷积神经网络的图像缩小方法及系统技术方案

技术编号：25805017 阅读：42 留言：0更新日期：2020-09-29 18:39

本发明专利技术涉及一种基于卷积神经网络的图像缩小方法及系统，首先对原始高分辨率训练图像进行预处理，得到原始高分辨率训练图像块组成的图像块数据集；然后设计图像缩小教师网络，并使用图像块数据集训练该网络；接着设计图像缩小学生网络，保持训练好的图像缩小教师网络的参数、权重不变，训练图像缩小学生网络；最后将原始高分辨率的测试图像输入到训练好的图像缩小学生网络，预测其缩小后的图像。本发明专利技术能够提高图像缩小后小图的质量。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络的图像缩小方法及系统
本专利技术涉及图像和视频处理
，特别是一种基于卷积神经网络的图像缩小方法及系统。
技术介绍
图像缩小是数字图像处理中的一个重要课题。随着计算机技术、多媒体技术以及网络通讯技术的快速发展，数字图像处理的相关技术被广泛地应用于人类社会生活的各个方面。视觉是人类获取外界信息的主要途径之一。最近几年来移动互联网的快速发展，越来越多用户在移动设备上观看图像，不同设备上的显示窗口大小也各不相同，如何在保证直观效果的同时，尽可能高效地将图像缩小到合适的尺寸是数字图像处理的关键性问题之一。早期提出的基于插值的方法，虽然可以直接将图像缩小到合适的尺寸，但是由于插值算法较为简单，图像在经过缩小后经常存在模糊、过度平滑的现象，进而影响到人眼直观感受，且这类方法依赖统计出来的图像先验，因此效果较差。目前先进的方法都是基于卷积神经网络，强大的特征表示及端到端的训练过程使得卷积神经网络能够重建出高质量的小图。但现有的方法都是在图像缩小的卷积神经网络后接上一个图像超分辨率网络来进行端到端的训练，导致生成的小图质量无法得到保证。
技术实现思路
有鉴于此，本专利技术的目的是提出一种基于卷积神经网络的图像缩小方法及系统，能够提高图像缩小后小图的质量。本专利技术采用以下方案实现：一种基于卷积神经网络的图像缩小方法，具体包括以下步骤：对原始高分辨率训练图像进行预处理，得到原始高分辨率训练图像块组成的图像块数据集；设计图像缩小教师网络，并使用图像块数据...

【技术保护点】
1.一种基于卷积神经网络的图像缩小方法，其特征在于，包括以下步骤：/n对原始高分辨率训练图像进行预处理，得到原始高分辨率训练图像块组成的图像块数据集；/n设计图像缩小教师网络，并使用图像块数据集训练该网络；/n设计图像缩小学生网络，保持训练好的图像缩小教师网络的参数、权重不变，训练图像缩小学生网络；/n将原始高分辨率的测试图像输入到训练好的图像缩小学生网络，预测其缩小后的图像。/n

【技术特征摘要】
1.一种基于卷积神经网络的图像缩小方法，其特征在于，包括以下步骤：
对原始高分辨率训练图像进行预处理，得到原始高分辨率训练图像块组成的图像块数据集；
设计图像缩小教师网络，并使用图像块数据集训练该网络；
设计图像缩小学生网络，保持训练好的图像缩小教师网络的参数、权重不变，训练图像缩小学生网络；
将原始高分辨率的测试图像输入到训练好的图像缩小学生网络，预测其缩小后的图像。

2.根据权利要求1所述的一种基于卷积神经网络的图像缩小方法，其特征在于，所述对原始高分辨率训练图像进行预处理，得到原始高分辨率训练图像块组成的图像块数据集具体包括以下步骤：
将原始高分辨率图像进行无重叠的切块，得到原始高分辨率训练图像块；
将得到的图像块进行旋转和翻转，得到用于训练的图像块数据集。

3.根据权利要求1所述的一种基于卷积神经网络的图像缩小方法，其特征在于，所述设计图像缩小教师网络，并使用图像块数据集训练该网络具体包括以下步骤：
将高分辨率训练图像块随机分成一个以上的批次，每个批次包含N个图像块；
将每个批次的图像块分别输入到图像缩小教师网络，得到各个图像块的图像缩小预测结果；
根据图像缩小教师网络的目标损失函数loss，利用反向传播方法计算所述图像缩小教师网络中各参数的梯度，并利用随机梯度下降方法更新参数；
以批次为单位重复进行上述步骤直至得到的损失函数值收敛到预设的阈值或达到迭代次数阈值，保存网络参数，完成图像缩小教师网络的训练过程。

4.根据权利要求3所述的一种基于卷积神经网络的图像缩小方法，其特征在于，所述图像缩小教师网络由逆亚像素卷积模块以及通道注意力密集残差模块构成。

5.根据权利要求4所述的一种基于卷积神经网络的图像缩小方法，其特征在于，所述将每个批次的图像块分别输入到图像缩小教师网络，得到各个图像块的图像缩小预测结果具体包括以下步骤：
A1：将高分辨率图像块输入到一个逆亚像素卷积模块，按如下公式重新排列图像特征：

式中，s代表图像缩小的尺度，s是大于1的整数，(c,h,w)分别代表特征的通道、高度、宽度，代表向下取整操作，invpixel()代表逆亚像素卷积操作，F0为经过逆亚像素卷积模块重新排列后的特征，代表高分辨率图像块；
A2：将得到的特征F0输入到一个通道注意力密集残差模块，首先计算密集通道注意力模块的输出：
F1＝Ψchannel(Hi)；
式中，F1为密集通道注意力模块的输出，Ψchannel为通道注意力模块，Hi代表密集连接模块，下标i表示第i个卷积层，其中密集连接模块公式如下：

式中，代表按照通道拼接特征操作，wi,bi分别为第i层采用的卷积核的权重和偏置；
然后计算残差模块输出：
F2＝ReLU(w2(...

【专利技术属性】
技术研发人员：牛玉贞，钟梦真，林家祺，刘文犀，
申请(专利权)人：福州大学，
类型：发明
国别省市：福建;35

全部详细技术资料下载我是这个专利的主人