分类器、神经网络模型训练方法、数据处理设备及介质技术

技术编号：21400119 阅读：58 留言：0更新日期：2019-06-19 07:18

本发明专利技术公开了分类器、神经网络模型训练方法、数据处理设备及介质。一种分类器包括：加权损失值计算装置，使得从神经网络模型输出的预测置信度经由其而得到该训练样本在各分类类别上的加权损失值；及参数调整装置，所述加权损失值反向输出到该参数调整装置，以使得其基于加权损失值调整该神经网络模型的参数，由此完成该分类器的神经网络模型的训练，其中，该加权损失值计算装置在用来度量训练样本的预测置信度与标注真实值的损失代价的损失函数中，添加加权因子，由此计算得到该训练样本在各分类类别上的加权损失值。通过在损失值计算时添加加权因子，能够调整神经网络模型的参数，优化网络模型，提高分类器的识别精度。

全部详细技术资料下载

【技术实现步骤摘要】
分类器、神经网络模型训练方法、数据处理设备及介质
本专利技术涉及分类技术，尤其涉及分类器、神经网络模型训练方法、数据处理设备及介质。
技术介绍
深度学习目前是计算机模式识别领域精度优秀、广泛使用的主流方法。在深度学习模型的应用过程中，首先需要将深度学习模型在大的训练数据集上进行训练，通过自定义的损失函数和反向传播算法(例如作为多次迭代的反向传播算法的梯度下降函数)学习迭代最优的神经网络模型参数，然后在验证集上验证达到指标后，部署到实际应用中进行分类或预测。深度学习在实际数据训练中，经常会出现由于训练样本的数量不均衡导致分类精度不高的问题。例如，对于物体识别，一些常见类别的样本的数目可能有很多，例如可以有几千到上万个以上，但是，不常见类别的样本由于出现频率低、难于收集，它们的数目则很少，例如可能仅几百个样本甚至更少。由于传统的损失函数(如交叉熵、均方误差等)没有考虑现实情况中这种不同类别的训练样本的数目的差异，会导致深度学习模型的总体分类结果更偏向于样本数更多的类别，尽管已经使损失函数的损失值最小，但对于小样本类别的分类的精度却仍然可能很低。例如，假设一个训练数据集中有两类样本A和B，样本A的数目远远大于样本B，则即便某个待分类物品与样本B属于同类，但经过这个训练数据集训练后的深度学习模型的分类结果可能更大概率为样本A，这就是由于训练样本的数量不均衡导致的分类精度不高的问题。由此，亟需一种提高分类器的识别精度的解决方案。
技术实现思路
为了解决以上问题之一，本专利技术提供了一种分类器、神经网络模型训练方法、数据处理设备及介质，以期克服分类器的识别精度不高的问题，...

【技术保护点】
1.一种基于神经网络模型的分类器，其特征在于，包括：加权损失值计算装置，被配置用于使得从所述神经网络模型输出的、作为神经网络模型的初步预测结果的、用于表示训练样本属于样本的各分类类别的概率的预测置信度，经由该加权损失值计算装置，得到该训练样本在各分类类别上的加权损失值；以及参数调整装置，由加权损失值计算装置输出的所述加权损失值输出到该参数调整装置，以使得所述参数调整装置基于所述加权损失值调整该神经网络模型的参数，由此完成该分类器的神经网络模型的训练；其中，该加权损失值计算装置在用来度量训练样本的所述预测置信度与标注真实值的损失代价的损失函数中，添加加权因子，由此计算得到该训练样本在各分类类别上的加权损失值。

【技术特征摘要】
1.一种基于神经网络模型的分类器，其特征在于，包括：加权损失值计算装置，被配置用于使得从所述神经网络模型输出的、作为神经网络模型的初步预测结果的、用于表示训练样本属于样本的各分类类别的概率的预测置信度，经由该加权损失值计算装置，得到该训练样本在各分类类别上的加权损失值；以及参数调整装置，由加权损失值计算装置输出的所述加权损失值输出到该参数调整装置，以使得所述参数调整装置基于所述加权损失值调整该神经网络模型的参数，由此完成该分类器的神经网络模型的训练；其中，该加权损失值计算装置在用来度量训练样本的所述预测置信度与标注真实值的损失代价的损失函数中，添加加权因子，由此计算得到该训练样本在各分类类别上的加权损失值。2.如权利要求1所述的分类器，其特征在于，其中，所述加权因子与以下至少之一有关：1)训练数据集中各分类类别的训练样本的数目；以及2)作为所述神经网络模型的初步预测结果的、用于表示训练样本属于样本的各分类类别的概率的预测置信度。3.如权利要求2所述的分类器，其特征在于，其中，所述加权因子与训练数据集中各分类类别的训练样本的数目呈反比例关系。4.如权利要求2所述的分类器，其特征在于，其中，所述加权因子与作为神经网络模型的初步预测结果的、用于表示训练样本属于样本的各分类类别的概率的预测置信度呈单调递减关系。5.如权利要求1～4中的任何一项所述的分类器，其特征在于，所述损失函数包括交叉熵损失函数。6.如权利要求1～4中的任何一项所述的分类器，其特征在于，所述参数调整装置基于所述加权损失值，通过多次迭代的后向传播算法来调整神经网络模型的参数。7.一种用于分类器的神经网络模型训练方法，其特征在于，包括：将训练样本输入到神经网络模型；神经网络模型输出...

【专利技术属性】
技术研发人员：蔡东阳，王涛，刘倩，刘洁，
申请(专利权)人：北京奇艺世纪科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人