分类优化方法及装置制造方法及图纸

技术编号：20546679 阅读：29 留言：0更新日期：2019-03-09 19:35

本申请实施例提供一种分类优化方法及装置，该方法包括：对预先构建的神经网络进行初始化处理，构建参数矩阵，利用参数矩阵对神经网络中的分类层参数进行正交初始化处理；将训练图像导入至所述神经网络，获得训练图像经过网络层后输出的特征向量；根据参数矩阵及特征向量计算得到损失函数；根据该损失函数对各网络层对应的网络层权值以及分类层对应的分类层权值进行梯度计算以更新网络层权值及分类层权值；根据更新网络层权值及分类层权值后的神经网络对输入图像进行训练。该分类优化方案增加了类别参数之间的相互正交的约束，促使不同类别相对独立，使得神经网络模型更具判别性。

Classification optimization method and device

The embodiment of this application provides a classification optimization method and device. The method includes: initializing the pre-constructed neural network, constructing the parameter matrix, orthogonal initialization of the parameters of the classification layer in the neural network by using the parameter matrix, importing the training image into the neural network, and obtaining the feature vector of the training image after passing through the network layer; The loss function is obtained by calculating the parameter matrix and eigenvector; the gradient calculation of the network layer weight corresponding to each network layer and the classification layer weight corresponding to the classification layer is carried out according to the loss function to update the network layer weight and the classification layer weight; and the input image is trained by the neural network after updating the network layer weight and the classification layer weight. The classification optimization scheme increases the constraints of orthogonality between class parameters, makes different classes relatively independent, and makes the neural network model more discriminant.

全部详细技术资料下载

【技术实现步骤摘要】
分类优化方法及装置
本专利技术涉及图像识别
，具体而言，涉及一种分类优化方法及装置。
技术介绍
多分类问题是实际应用场景中常见的问题之一。在深度神经网络中，Softmax是最常被使用的损失函数。这是因为，Softmax具有结构简单和梯度运算高效等特点。但是许多研究已经表明，仅仅采用Softmax损失函数监督网络模型进行训练时，得到的特征判别性不足。切确地说，在图像比较相似时，网络对图像的分类容易出错。这主要是因为，Softmax仅对类间距离做了优化，未收缩类内样本的距离。现有方案中有基于Softmax的改进方法和基于多元组的Contrastive(二元组)和Triplet(三元组)方法以用于解决上述问题。但是，基于Softmax损失的改进方法主要关注于加性间距，如AM-Softmax，但都未对类别中心进行约束，而是随模型训练进行动态学习。而多元组方法虽然对样本间的距离做约束，但高质量的样本对存在生成困难的问题，且梯度更新运算较为复杂。
技术实现思路
有鉴于此，本申请的目的在于，提供一种分类优化方法及装置以改善上述问题。本申请实施例提供一种分类优化方法，所述方法包括：对预先建立的神经网络进行初始化处理，所述神经网络包括分类层及多个网络层；构建参数矩阵，利用所述参数矩阵对所述神经网络中的分类层参数进行正交初始化处理，所述参数矩阵包括所述分类层的分类层权值，且所述参数矩阵中各个行向量两两正交；将训练图像导入至所述神经网络，获得所述训练图像经过所述网络层后输出的特征向量；根据所述参数矩阵及所述特征向量计算得到损失函数；根据所述损失函数对各所述网络层对应的网络层权...

【技术保护点】
1.一种分类优化方法，其特征在于，所述方法包括：对预先建立的神经网络进行初始化处理，所述神经网络包括分类层及多个网络层；构建参数矩阵，利用所述参数矩阵对所述神经网络中的分类层参数进行正交初始化处理，所述参数矩阵包括所述分类层的分类层权值，且所述参数矩阵中各个行向量两两正交；将训练图像导入至所述神经网络，获得所述训练图像经过所述网络层后输出的特征向量；根据所述参数矩阵及所述特征向量计算得到损失函数；根据所述损失函数对各所述网络层对应的网络层权值以及所述分类层对应的分类层权值进行梯度计算以更新所述网络层权值及所述分类层权值；根据更新网络层权值及分类层权值后的神经网络对输入图像进行训练。

【技术特征摘要】
1.一种分类优化方法，其特征在于，所述方法包括：对预先建立的神经网络进行初始化处理，所述神经网络包括分类层及多个网络层；构建参数矩阵，利用所述参数矩阵对所述神经网络中的分类层参数进行正交初始化处理，所述参数矩阵包括所述分类层的分类层权值，且所述参数矩阵中各个行向量两两正交；将训练图像导入至所述神经网络，获得所述训练图像经过所述网络层后输出的特征向量；根据所述参数矩阵及所述特征向量计算得到损失函数；根据所述损失函数对各所述网络层对应的网络层权值以及所述分类层对应的分类层权值进行梯度计算以更新所述网络层权值及所述分类层权值；根据更新网络层权值及分类层权值后的神经网络对输入图像进行训练。2.根据权利要求1所述的分类优化方法，其特征在于，所述分类层包括多个类别参数，所述构建参数矩阵，利用所述参数矩阵对所述神经网络中的分类层参数进行正交初始化处理的步骤，包括：根据所述分类层中的类别参数的个数以及各类别参数的维度数构建参数矩阵，所述参数矩阵中各行类别参数之间两两正交；根据所述参数矩阵对所述神经网络包含的分类层参数进行正交初始化处理。3.根据权利要求1所述的分类优化方法，其特征在于，所述将训练图像导入至所述神经网络，获得所述训练图像经过所述网络层后输出的特征向量的步骤，包括：将训练图像导入至所述神经网络，对所述训练图像进行特征提取；将提取到的特征与所述网络层对应的网络层权值进行矩阵计算；对得到的矩阵计算结果进行归一化处理以得到所述训练图像经过所述网络层后输出的特征向量。4.根据权利要求1所述的分类优化方法，其特征在于，所述根据所述参数矩阵及所述特征向量计算得到损失函数的步骤，包括：根据所述参数矩阵、所述特征向量以及所述训练图像的数量计算得到初始函数；根据所述初始函数及所述分类层权值计算得到损失函数。5.根据权利要求4所述的分类优化方法，其特征在于，所述根据所述参数矩阵、所述特征向量以及所述训练图像的数量计算得到初始函数的步骤，包括：根据所述参数矩阵、所述特征向量以及所述训练图像的数量按以下公式计算得到初始函数：其中，Losssoftmax为初始函数，WFCclass为所述分类层的参数矩阵，M为训练图像的个数，K为所述分类层的类别数，fi为第i个训练图像经过所述网络层后输出的特征向量，fj为第j个训练图像经过所述网络层后输出的特征向量，yi为第...

【专利技术属性】
技术研发人员：苏灿平，余清洲，许清泉，洪炜冬，张伟，
申请(专利权)人：厦门美图之家科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人