【技术实现步骤摘要】
训练分类模型的方法和装置及分类方法
[0001]本公开涉及信息处理领域,具体涉及一种训练分类模型的方法和装置以及分类方法。
技术介绍
[0002]近年来,深度卷积神经网络的快速发展极大地改善了图像识别尤其是人脸识别的技术水平。除了不断发展的架构外,大规模的训练样本集的收集在人脸识别中也起着至关重要的作用。然而,在现实世界中,人脸数据样本通常呈现长尾分布。也就是说,只有一小部分人具有足够的样本,而对于其他大部分人来说,只有很少的样本可用。使用这样的呈现长尾分布的训练样本集对人脸识别模型进行训练难以获得识别性能好的模型,从而导致使用这样的模型对人脸进行识别时不能取得较高的准确度。
技术实现思路
[0003]在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。但是,应当理解,这个概述并不是关于本公开的穷举性概述。它并不是意图用来确定本公开的关键性部分或重要部分,也不是意图用来限定本公开的范围。其目的仅仅是以简化的形式给出关于本公开的某些概念,以此作为稍后给出的更详细描述的前序。
[0 ...
【技术保护点】
【技术特征摘要】
1.一种训练分类模型的方法,包括:使用第一样本集和第二样本集对所述分类模型进行训练,以计算所述分类模型的分类损失;提取所述第一样本集和所述第二样本集中的每个样本的权重向量和特征向量;计算所述第一样本集中的所有样本的权重向量的平均权重向量以及所述第一样本集中的所有样本的特征向量的平均特征向量;基于所述第二样本集中的每个样本的权重向量与所述平均权重向量之间的差来计算权重损失,并且基于所述第二样本集中的每个样本的特征向量与所述平均特征向量之间的差来计算特征损失;基于所述特征损失和所述权重损失中的至少一个以及所述分类损失来计算所述分类模型的总损失;以及基于所述总损失来调整所述分类模型的参数,直到满足预定条件,以获得经训练的分类模型。2.根据权利要求1所述的方法,其中,所述权重损失和所述平均权重向量分别基于下式来计算:来计算:其中,L
W_up
表示所述权重损失,C
l
表示所述第二样本集,w
i
表示所述第二样本集中的第i个样本的权重向量,w
mean
表示所述平均权重向量,C
h
表示所述第一样本集,m表示所述第一样本集中的第一样本的数目,w
j
表示所述第一样本集中的第j个样本的权重向量。3.根据权利要求1所述的方法,其中,所述特征损失和所述平均特征向量分别基于下式来计算:来计算:其中,L
F_up
表示所述特征损失,C
l
表示所述第二样本集,f
i
表示所述第二样本集中的第i个样本的特征向量,f
mean
表示所述平均特征向量,C
h
表示所述第一样本集,m表示所述第一样本集中的第一样本的数目,f<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。