神经网络权重参数的训练方法、特征分类方法及对应装置制造方法及图纸

技术编号：24123848 阅读：30 留言：0更新日期：2020-05-13 03:56

本发明专利技术实施例提供一种神经网络权重参数的训练方法、特征分类方法及对应装置，神经网络权重参数的训练方法包括：获取样本数据集，样本数据集中的样本数据带有类标签；获取初始权重参数，所述初始权重参数包括类代理参数；构建所述样本数据集与所述初始权重参数的相似度损失函数，所述相似度损失函数包括基于本类代理参数与所述目标样本数据的相似度的递减部，以及基于他类代理参数与所述目标样本数据的相似度的递增部；通过反向传播不断对所述初始权重参数进行调整，直到所述相似度损失函数最小，得到所述最小相似度损失函数对应的目标权重参数。通过在权重参数中增加类代理参数，使特征判别能力得到提高，没有超参数的添加，降低调参数的复杂度。

Training method, feature classification method and corresponding device of neural network weight parameters

全部详细技术资料下载

【技术实现步骤摘要】
神经网络权重参数的训练方法、特征分类方法及对应装置
本专利技术涉及神经网络
，尤其涉及一种神经网络权重参数的训练方法、特征分类方法及对应装置。
技术介绍
神经网络包括识别神经网络、检测神经网络、分类神经网络等，这些神经网络在训练时，通常都是作为分类问题进行训练。在识别神经网络中，常用的分类损失函数是交叉熵损失，通过损失函数不断调整权重参数，使得神经网络的损失函数最小，比如人脸识别领域中，对人脸识别神经网络的训练也是基于交叉熵分类损失函数的，但交叉熵损失不能将不同人的特征足够地分开，因此，为增加识别神经网络的判别能力，会在训练时，在交叉熵损失函数中添加裕量因子。由于增加了裕量因子，相当于引入了超参数，使得到神经网络在训练时需要对超参数也进行调整，导致神经网络在训练时的调参变得复杂。
技术实现思路
本专利技术实施例提供一种神经网络权重参数的训练方法，能够在提高特征判别能力的同时，降低调参数的复杂度。第一方面，本专利技术实施例提供一种神经网络权重参数的训练方法，包括：获取样本数据集，所述样本数据集中的样本数据带有类标签；获取初始权重参数，所述初始权重参数包括类代理参数，所述类代理参数与目标样本数据的类标签相对应的为本类代理参数，与所述目标样本数据的类标签不对应的为他类代理参数；构建所述样本数据集与所述初始权重参数的相似度损失函数，所述相似度损失函数包括基于本类代理参数与所述目标样本数据的相似度的递减部，以及基于他类代理参数与所述目标样本数据的相似度的递增部；...

【技术保护点】
1.一种神经网络权重参数的训练方法，其特征在于，包括以下步骤：/n获取样本数据集，所述样本数据集中的样本数据带有类标签；/n获取初始权重参数，所述初始权重参数包括类代理参数，所述类代理参数与目标样本数据的类标签相对应的为本类代理参数，与所述目标样本数据的类标签不对应的为他类代理参数；/n构建所述样本数据集与所述初始权重参数的相似度损失函数，所述相似度损失函数包括基于本类代理参数与所述目标样本数据的相似度的递减部，以及基于他类代理参数与所述目标样本数据的相似度的递增部；/n通过反向传播不断对所述初始权重参数进行调整，直到所述相似度损失函数最小，得到所述最小相似度损失函数对应的目标权重参数。/n

【技术特征摘要】
1.一种神经网络权重参数的训练方法，其特征在于，包括以下步骤：
获取样本数据集，所述样本数据集中的样本数据带有类标签；
获取初始权重参数，所述初始权重参数包括类代理参数，所述类代理参数与目标样本数据的类标签相对应的为本类代理参数，与所述目标样本数据的类标签不对应的为他类代理参数；
构建所述样本数据集与所述初始权重参数的相似度损失函数，所述相似度损失函数包括基于本类代理参数与所述目标样本数据的相似度的递减部，以及基于他类代理参数与所述目标样本数据的相似度的递增部；
通过反向传播不断对所述初始权重参数进行调整，直到所述相似度损失函数最小，得到所述最小相似度损失函数对应的目标权重参数。

2.如权利要求1所述的神经网络权重参数的训练方法，其特征在于，所述获取初始权重参数，包括：
获取随机初始化权重参数，所述随机初始化权重参数包括随机初始化的类代理参数；
将所述随机初始化权重参数进行归一化，以使每个类代理参数的模长为预设的单位模长，得到初始权重参数。

3.如权利要求2所述的神经网络权重参数的训练方法，其特征在于，所述构建所述样本数据集与所述初始权重参数的相似度损失函数，包括：
提取目标样本数据的归一化特征；
分别计算所述目标样本数据的归一化特征与本类代理参数的本类相似度，以及所述目标样本数据的归一化特征与他类代理参数的他类相似度；
构建基于所述本类相似度递减，且基于所述他类相似度递增的损失函数，以使在所述本类相似度增大，所述他类相似度减小时，所述相似度损失函数变小。

4.如权利要求3所述的神经网络权重参数的训练方法，其特征在于，所述本类相似度以及他类相似度均为余弦相似度，所述构建基于所述本类相似度递减，且基于所述他类相似度递增的损失函数，包括：
构建本类相似度与预设值的平方差作为损失函数的递减部分；
构建他类相似度之和作为损失函数的递增部分；
基于所述损失函数的递减部分与递增部分构建所述损失函数。

5.一种特征分类方法，其特征在于，包括以下步骤：
获取特征提取网络输出的待分类特征；
获取预先训练好的目标权重参数，其中，所述目标权重参数通过如权利要求1至4中任一项神经网络权重参数的训练方法得到，所述目标权重参数包括与所述待分类特征对应的本类代理参数以及他类代理参数；
将所述待分类特征与所述预先训练好的目标权重参数进行相似度计算，得到所述待分类特征与本类代理参数的本类相似度；
基于...

【专利技术属性】
技术研发人员：宋方良，
申请(专利权)人：深圳云天励飞技术有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人