一种深度神经网络训练方法技术

技术编号：19389202 阅读：20 留言：0更新日期：2018-11-10 02:08

本发明专利技术提出了一种深度卷积网络训练方法。该训练方法中，将Softmax Loss损失函数和基于余弦距离的Center Loss损失函数相结合作为误差损失函数，更新网络中的参数，对深度网络进行训练。Softmax Loss损失函数是一个比较通用的用于深度网络全连接层的损失函数，可以有效实现多类分类问题，但它容易丢失样本图像的类内距和类间距信息，有一定的局限性。基于余弦距离的Center Loss度量学习模块，通过计算每个样本和对应类中心之间的余弦距离作为损失函数，考虑到了输入特征图的方向信息，同类样本之间相互靠近，网络输出的特征具有明显的判别性，可以提高网络最终的识别结果。

A deep neural network training method

The invention proposes a deep convolution network training method. In this training method, the combination of Softmax Loss loss function and Cosine Distance-based Core Loss loss function is used as error loss function to update the parameters of the network and train the deep network. Softmax Loss loss function is a general loss function used in the full connection layer of deep network. It can effectively realize multi-class classification problem. However, it is easy to lose the information of the inter-class distance and the inter-class distance of sample images, which has some limitations. The Cosine Distance-based Core Loss Metric Learning Module calculates the cosine distance between each sample and the corresponding class center as a loss function. Considering the direction information of the input feature graph, the similar samples are close to each other, and the features of the network output have obvious discrimination, which can improve the final recognition of the network. Result.

全部详细技术资料下载

【技术实现步骤摘要】
一种深度神经网络训练方法
本专利技术提出了一种深度神经网络的训练方法，属于机器学习领域。
技术介绍
近年来，随着深度学习的发展，各种深度学习网络模型交替出现，为图像分类带来了新的解决方案。为了提升深度学习网络的分类性能，一方面可以通过改变网络结构，还可以通过训练方法的改进，本专利技术正是提出了一种新的训练方法对深度神经网络进行训练，从而实现图像的分类问题。通常深度学习卷积网络一般使用Softmax函数实现分类功能，但是这种网络很容易丢失输入样本图像的类内距和类间距信息。将度量学习融入深度卷积网络的学习过程中，可以有效地捕捉到输入样本的类内距和类间距信息，扩大不同类样本之间的距离，减小同类样本之间的距离，有效地提高网络最终的识别结果。
技术实现思路
本专利技术的目的是提供一种深度神经网络训练方法，神经网络经过不断的前向传播和反向传播来调整网络中的权值矩阵，使网络的损失函数降到最低，并保持稳定范围之内，最终完成训练。本专利技术解决其技术问题所采用的技术方案是：卷积神经网络，主要包括输入层、卷积层、降采样层和全连接层组成。输入层是待处理的输入数据或图像，卷积层和降采样层交替出现实现自动提取特征信息，全连接层实现图像分类功能，全连接层的最后一层是输出层。卷积神经网络的学习过程是一种有监督学习，本质上是输入到输出的映射，它的训练样本集是包含的是一系列向量对(X,Yp)，其中X表示输入向量，Yp表示是理想输出向量。卷积神经网络可以自主地学习到图像中的特征，找到输出到输出之间的映射关系，而不需要提前设计出输入到输出之间的计算公式。卷积神经网络训练之前，需要初始化网络中的权值...

【技术保护点】
1.一种深度神经网络的训练方法，其特征在于，将Softmax Loss损失函数和基于余弦距离的Center Loss损失函数相结合作为误差损失函数，用于反向传播过程中更新网络中的参数，对深度网络进行训练。

【技术特征摘要】
1.一种深度神经网络的训练方法，其特征在于，将SoftmaxLoss损失函数和基于余弦距离的CenterLoss损失函数相结合作为误差损失函数，用于反向传播过程中更新网络中的参数，对深度网络进行训练。2.根据权利要求1所述的一种深度神经网络的训练方法，其特征在于，损失函数的计算包括：(1)计算每个输入图像的特征和对应类中心特征之间的余弦距离作为损失函数，即基于余弦距的CenterLoss；(2)计算SoftmaxLoss损失函数。3....

【专利技术属性】
技术研发人员：吕岳，吕淑静，张茹玉，
申请(专利权)人：嘉兴善索智能科技有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人