卷积神经网络的训练方法及图像处理方法、装置制造方法及图纸

技术编号：18498109 阅读：40 留言：0更新日期：2018-07-21 20:40

本发明专利技术公开了一种卷积神经网络的训练方法及图像处理方法、装置、计算机存储介质、计算机可读存储介质、计算机程序，所述卷积神经网络的训练方法包括：在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络；基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练。所述图像处理方法包括：将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理，得到第三卷积神经网络；其中，所述第二卷积神经网络中至少一个设在线性结构层后的非线性修正层被删除；将图像输入所述第三卷积神经网络；经所述第三卷积神经网络对所述图像进行处理，得到所述图像的处理结果。

Training method of convolution neural network and image processing method and device

The invention discloses a training method of a convolution neural network, an image processing method, a device, a computer storage medium, a computer readable storage medium, and a computer program. The training method of the convolution neural network includes the removal of at least one nonlinear repair in the first convolution neural network after a linear structural layer. The second convolution neural network is obtained by the positive layer, and the second convolution neural network is supervised and trained based on the training image and the annotation information of the trained image. The image processing method includes: merging at least one serial branch and / or at least one parallel branch of a trained second convolution neural network to obtain a third convolution neural network; in which, the nonlinear correction layer after at least one online sex structure layer in the second convolution neural network is deleted; The image is input to the third convolution neural network, and the image is processed by the third convolution neural network to obtain the processing result of the image.

全部详细技术资料下载

【技术实现步骤摘要】
卷积神经网络的训练方法及图像处理方法、装置
本专利技术涉及深度学习
，尤其涉及一种卷积神经网络的训练方法及图像处理方法、装置、计算机设备、计算机可读存储介质、计算机程序。
技术介绍
随着深度卷积神经网络的发展，更深或更宽的网络结构不断刷新着各个计算机视觉数据集的准确率。然而，网络的加深或加宽势必会增加网络在训练及测试过程中的运行时间。近年来，为了能够在低功耗、低计算资源的平台上运行深度卷积神经网络，越来越多的研究人员开始关注轻量级且训练及测试过程所需时间较短的网络。如何设计一些轻量级的卷积神经网络以实现更短的训练时间或更短的测试时间成为了深度学习研究的一个重要方向。
技术实现思路
本专利技术实施例提供了一种卷积神经网络的训练方法及图像处理方法、装置、计算机设备、计算机可读存储介质、计算机程序。本专利技术实施例提供一种卷积神经网络的训练方法，所述方法包括：在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络；基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练。上述方案中，所述第一卷积神经网络包括残差单元；所述在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络，包括：在所述第一卷积神经网络中删除残差单元中部分或全部设在线性结构层后的非线性修正层，得到第二卷积神经网络。上述方案中，所述线性结构层包括：卷积层或者批归一化层。上述方案中，所述基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练，包括：初始化所述第二卷积神经网络的训练参数，并迭代执行如下步骤：...

【技术保护点】
1.一种卷积神经网络的训练方法，其特征在于，所述方法包括：在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络；基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练。

【技术特征摘要】
1.一种卷积神经网络的训练方法，其特征在于，所述方法包括：在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络；基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练。2.根据权利要求1所述的方法，其特征在于，所述第一卷积神经网络包括残差单元；所述在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层，得到第二卷积神经网络，包括：在所述第一卷积神经网络中删除残差单元中部分或全部设在线性结构层后的非线性修正层，得到第二卷积神经网络。3.根据权利要求1或2所述的方法，其特征在于，所述线性结构层包括：卷积层或者批归一化层。4.根据权利要求1至3任一项所述的方法，其特征在于，所述基于训练图像和所述训练图像的标注信息，对所述第二卷积神经网络进行监督训练，包括：初始化所述第二卷积神经网络的训练参数，并迭代执行如下步骤：将训练图像输入所述第二卷积神经网络，基于所述训练参数，计算所述训练样本的处理结果，更新所述训练参数；直至所述训练图像的处理结果收敛；其中，所述训练图像的处理结果收敛是指所述训练图像的处理结果与所述训练图像的标注信息的差值小于等于目标门限值。5.一种图像处理方法，其特征在于，所述方法包括：将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理，得到第三卷积神经网络；其中，所述第二卷积神经网络中至少一个设在线性结构层后的非线...

【专利技术属性】
技术研发人员：程光亮，石建萍，
申请(专利权)人：北京市商汤科技开发有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人