卷积神经网络的训练方法及图像处理方法、装置制造方法及图纸

技术编号:18498109 阅读:40 留言:0更新日期:2018-07-21 20:40
本发明专利技术公开了一种卷积神经网络的训练方法及图像处理方法、装置、计算机存储介质、计算机可读存储介质、计算机程序,所述卷积神经网络的训练方法包括:在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络;基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练。所述图像处理方法包括:将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理,得到第三卷积神经网络;其中,所述第二卷积神经网络中至少一个设在线性结构层后的非线性修正层被删除;将图像输入所述第三卷积神经网络;经所述第三卷积神经网络对所述图像进行处理,得到所述图像的处理结果。

Training method of convolution neural network and image processing method and device

The invention discloses a training method of a convolution neural network, an image processing method, a device, a computer storage medium, a computer readable storage medium, and a computer program. The training method of the convolution neural network includes the removal of at least one nonlinear repair in the first convolution neural network after a linear structural layer. The second convolution neural network is obtained by the positive layer, and the second convolution neural network is supervised and trained based on the training image and the annotation information of the trained image. The image processing method includes: merging at least one serial branch and / or at least one parallel branch of a trained second convolution neural network to obtain a third convolution neural network; in which, the nonlinear correction layer after at least one online sex structure layer in the second convolution neural network is deleted; The image is input to the third convolution neural network, and the image is processed by the third convolution neural network to obtain the processing result of the image.

【技术实现步骤摘要】
卷积神经网络的训练方法及图像处理方法、装置
本专利技术涉及深度学习
,尤其涉及一种卷积神经网络的训练方法及图像处理方法、装置、计算机设备、计算机可读存储介质、计算机程序。
技术介绍
随着深度卷积神经网络的发展,更深或更宽的网络结构不断刷新着各个计算机视觉数据集的准确率。然而,网络的加深或加宽势必会增加网络在训练及测试过程中的运行时间。近年来,为了能够在低功耗、低计算资源的平台上运行深度卷积神经网络,越来越多的研究人员开始关注轻量级且训练及测试过程所需时间较短的网络。如何设计一些轻量级的卷积神经网络以实现更短的训练时间或更短的测试时间成为了深度学习研究的一个重要方向。
技术实现思路
本专利技术实施例提供了一种卷积神经网络的训练方法及图像处理方法、装置、计算机设备、计算机可读存储介质、计算机程序。本专利技术实施例提供一种卷积神经网络的训练方法,所述方法包括:在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络;基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练。上述方案中,所述第一卷积神经网络包括残差单元;所述在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络,包括:在所述第一卷积神经网络中删除残差单元中部分或全部设在线性结构层后的非线性修正层,得到第二卷积神经网络。上述方案中,所述线性结构层包括:卷积层或者批归一化层。上述方案中,所述基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练,包括:初始化所述第二卷积神经网络的训练参数,并迭代执行如下步骤:将训练图像输入所述第二卷积神经网络,基于所述训练参数,计算所述训练样本的处理结果,更新所述训练参数;直至所述训练图像的处理结果收敛;其中,所述训练图像的处理结果收敛是指所述训练图像的处理结果与所述训练图像的标注信息的差值小于等于目标门限值。本专利技术实施例提供一种图像处理方法,所述方法包括:将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理,得到第三卷积神经网络;其中,所述第二卷积神经网络中至少一个设在线性结构层后的非线性修正层被删除;将图像输入所述第三卷积神经网络;经所述第三卷积神经网络对所述图像进行处理,得到所述图像的处理结果。上述方案中,所述串行分支包括至少二个串接的线性结构层;对所述串行分支进行合并处理,包括:将所述串行分支中的一线性结构层并入另一线性结构层。上述方案中,所述至少二个串接的线性结构层,包括:二个串接的卷积核大小不同的卷积层;对所述串行分支进行合并处理,包括:删除一卷积层、并将删除的卷积层的参数合并到另一卷积层中。上述方案中,所述至少二个串接的线性结构层,包括:串接的卷积层和批归一化层;对所述串行分支进行合并处理,包括:删除批归一化层、并将批归一化的尺度和偏移参数合并到卷积层的卷积核参数中。上述方案中,所述并行分支包括:并行的线性结构分支和跳转分支;对所述并行分支进行合并处理,包括:删除跳转分支、并在线性结构分支中卷积层的卷积核的中心位置加1。上述方案中,所述并行分支包括:并行的二个线性结构分支;对所述并行分支进行合并处理,包括:删除并行分支中的一线性结构分支、并将删除的一线性结构分支的卷积核中的权重向量加到另一线性结构的卷积核的中心位置。上述方案中,所述经所述第三卷积神经网络对所述训练图像进行处理,包括:经所述第三卷积神经网络对图像进行对象识别、分类处理、图像分割处理或对象检测/跟踪处理。上述方案中,所述第二卷积神经网络的残差单元中部分或全部设在线性结构层后的非线性修正层被删除。上述方案中,所述线性结构层包括:卷积层或者批归一化层。本专利技术实施例提供一种卷积神经网络的训练装置,所述装置包括:删除单元,用于在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络;训练单元,用于基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练。上述方案中,所述第一卷积神经网络包括残差单元;所述删除单元,用于在所述第一卷积神经网络中删除残差单元中部分或全部设在线性结构层后的非线性修正层,得到第二卷积神经网络。上述方案中,所述线性结构层包括:卷积层或者批归一化层。上述方案中,所述训练单元,用于初始化所述第二卷积神经网络的训练参数,并迭代执行如下步骤:将训练图像输入所述第二卷积神经网络,基于所述训练参数,计算所述训练样本的处理结果,更新所述训练参数;直至所述训练图像的处理结果收敛;其中,所述训练图像的处理结果收敛是指所述训练图像的处理结果与所述训练图像的标注信息的差值小于等于目标门限值。本专利技术实施例提供一种图像处理装置,所述装置包括:合并单元,用于将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理,得到第三卷积神经网络;其中,所述第二卷积神经网络中至少一个设在线性结构层后的非线性修正层被删除;图像处理单元,用于将图像输入所述第三卷积神经网络;经所述第三卷积神经网络对所述图像进行处理,得到所述图像的处理结果。上述方案中,所述串行分支包括至少二个串接的线性结构层;所述合并单元,用于将所述串行分支中的一线性结构层并入另一线性结构层。上述方案中,所述至少二个串接的线性结构层,包括:二个串接的卷积核大小不同的卷积层;所述合并单元,用于删除一卷积层、并将删除的卷积层的参数合并到另一卷积层中。上述方案中,所述至少二个串接的线性结构层,包括:串接的卷积层和批归一化层;所述合并单元,用于删除批归一化层、并将批归一化的尺度和偏移参数合并到卷积层的卷积核参数中。上述方案中,所述并行分支包括:并行的线性结构分支和跳转分支;所述合并单元,用于对所述并行分支进行合并处理,包括:删除跳转分支、并在线性结构分支中卷积层的卷积核的中心位置加1。上述方案中,所述并行分支包括:并行的二个线性结构分支;所述合并单元,用于删除并行分支中的一线性结构分支、并将删除的一线性结构分支的卷积核中的权重向量加到另一线性结构的卷积核的中心位置。上述方案中,所述图像处理单元,用于经所述第三卷积神经网络对图像进行对象识别、分类处理、图像分割处理或对象检测/跟踪处理。上述方案中,所述第二卷积神经网络的残差单元中部分或全部设在线性结构层后的非线性修正层被删除。上述方案中,所述线性结构层包括:卷积层或者批归一化层。本专利技术实施例提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器上存储有计算机可执行指令,所述处理器运行所述存储器上的计算机可执行指令时,实现本专利技术实施例提供的卷积神经网络的训练方法或者图像处理方法。本专利技术实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时,实现本专利技术实施例提供的卷积神经网络的训练方法或者图像处理方法。本专利技术实施例提供一种计算机程序,包括计算机指令,当所述计算机指令在设备的处理器中运行时,实现本专利技术实施例提供的卷积神经网络的训练方法或者图像处理方法。本专利技术实施例的技术方案中,可将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理,得到第三卷积神经网络;其中,所述第二卷积神经网络中至少一个设在线性结构层后的非线性修正层被本文档来自技高网...

【技术保护点】
1.一种卷积神经网络的训练方法,其特征在于,所述方法包括:在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络;基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练。

【技术特征摘要】
1.一种卷积神经网络的训练方法,其特征在于,所述方法包括:在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络;基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练。2.根据权利要求1所述的方法,其特征在于,所述第一卷积神经网络包括残差单元;所述在第一卷积神经网络中删除至少一个设在线性结构层后的非线性修正层,得到第二卷积神经网络,包括:在所述第一卷积神经网络中删除残差单元中部分或全部设在线性结构层后的非线性修正层,得到第二卷积神经网络。3.根据权利要求1或2所述的方法,其特征在于,所述线性结构层包括:卷积层或者批归一化层。4.根据权利要求1至3任一项所述的方法,其特征在于,所述基于训练图像和所述训练图像的标注信息,对所述第二卷积神经网络进行监督训练,包括:初始化所述第二卷积神经网络的训练参数,并迭代执行如下步骤:将训练图像输入所述第二卷积神经网络,基于所述训练参数,计算所述训练样本的处理结果,更新所述训练参数;直至所述训练图像的处理结果收敛;其中,所述训练图像的处理结果收敛是指所述训练图像的处理结果与所述训练图像的标注信息的差值小于等于目标门限值。5.一种图像处理方法,其特征在于,所述方法包括:将训练完成的第二卷积神经网络中的至少一串行分支和/或至少一并行分支进行合并处理,得到第三卷积神经网络;其中,所述第二卷积神经网络中至少一个设在线性结构层后的非线...

【专利技术属性】
技术研发人员:程光亮石建萍
申请(专利权)人:北京市商汤科技开发有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1