【技术实现步骤摘要】
训练神经网络的方法、对象识别方法和设备以及介质
本公开总地涉及对象识别,具体地涉及训练神经网络以用于识别对象的领域。
技术介绍
Softmax损失函数被广泛用作对象识别,并且该函数可以保证特征的可分离性。然而,当类内变化可能大于类间差异时(例如使用具有数百万个类进行面部识别时),此时Softmax损失函数不能充分有效地区分特征。最近,主流方法是通过在Softmax损失函数中添加间距margin,即使用间距(margin)损失函数代替Softmax损失函数来加大学习的难度,逼迫模型不断学习更具区分性的特征,从而使得类间距离更大,类内距离更小。DengJ、GuoJ,ZafeiriouS在2018年的arxiv上发表的文章《ArcFace:AdditiveAngularMarginLossforDeepFaceRecognition》提出了一种几何可解释的间距损失函数,被称为ArcFace(cos(θ+m))。该间距损失函数基于L2规范化的权重和特征,直接最大化角度的决策边界(arc)。
技术实现思路
...
【技术保护点】
1.一种训练神经网络的方法,其特征在于包括:/n使用神经网络的初始模型从第一训练集中提取特征;/n根据第一训练集中的各个类的至少一个属性的分布来调整第一类和至少另一个类之间的与间距相关联的参数;/n根据调整后的与间距相关联的参数来计算损失;/n使用所计算的损失和反向传播算法来更新初始模型,以得到经过训练的模型。/n
【技术特征摘要】 【专利技术属性】
1.一种训练神经网络的方法,其特征在于包括:
使用神经网络的初始模型从第一训练集中提取特征;
根据第一训练集中的各个类的至少一个属性的分布来调整第一类和至少另一个类之间的与间距相关联的参数;
根据调整后的与间距相关联的参数来计算损失;
使用所计算的损失和反向传播算法来更新初始模型,以得到经过训练的模型。
2.根据权利要求1所述的方法,其中所述至少一个属性是第一训练集中的类的样本数量。
3.根据权利要求1-2中任一项所述的方法,其中所述与间距相关联的参数是间距本身,并且所述方法包括,使用间距损失函数来计算损失。
4.根据权利要求3所述的方法,其中所述调整包括:根据第一类的样本数量直接确定间距使得所述间距与所述样本数量负相关。
5.根据权利要求3所述的方法,其中所述调整包括:将间距设置为第一类的样本数量的函数,使得间距与所述样本数量负相关。
6.根据权利要求3所述的方法,其中所述调整包括:使用Q-学习函数,根据当前间距、类的样本数量、类内方差和类间距离来确定间距的变化趋势。
7.根据权利要求3所述的方法,其中所述调整包括:通过特征增广增大第一类的样本数量来调整间距。
8.根据权利要求7所述的方法,其中使用近邻分布进行特征增广。
9.根据权利要求7所述的方法,其中使用高斯分布进行特征增广。
10.根据权利要求1所述的方法,其中所述属性是第一训练集中的类的难度。
11.根据权利要求10所述的方法,其中所述难度能够手动确定,或者基于所述第一类与至少另一个类之间的类中心距离或类中心相似度确定。
12.根据权利要求10-11中任一项所述的方法,其中所述与间距相关联的参数是类中心相似度,并且所述方法包括,对难度高于预定阈值的类,根据类中心相似度来计算损失。
13.根据权利要求1所述的方法,其中所述属性是第一训练集中的类的重要性。
技术研发人员:黄耀海,陶训强,彭健腾,邓伟洪,胡佳妮,
申请(专利权)人:佳能株式会社,北京邮电大学,
类型:发明
国别省市:日本;JP
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。