The present invention relates to a supervised deep learning method based on feedback training. In the process of training supervised deep learning model, each sample in the training set is sampled with a sampling probability at the beginning of each iteration, and the sampling probability is dynamically adjusted with the predicted loss value of each sample. Compared with the prior art, the method has the advantages of improving the training effect by correlating the predicted loss value of each sample in the supervised learning training process with its own sampling frequency, and realizing the adjustment of the probability of the outlier sample being sampled by means of feedback training.
【技术实现步骤摘要】
一种基于反馈训练的有监督深度学习方法
本专利技术涉及深度学习领域,尤其是涉及一种基于反馈训练的有监督深度学习方法。
技术介绍
现在的有监督深度学习方法在使用过程中,需要使用大量的样本数据进行学习,为了降低有监督深度学习模型训练时对硬件的需求,通常采用小批量采样或单样本输入的方式训练模型。通常的采样方式为均匀采样或采用按序输入。在该种情况下,大量的常规样本与小量的离群样本会有相等的概率被送入模型训练,导致模型难以学到小量离群样本的空间分布。当模型的训练目标需要检测或识别小量离群样本时,通过常规采样方式的有监督训练不仅降低了模型的准确率,而且降低了模型的训练速度。为了解决上述问题,现有的解决方式通常为数据重采样、类别均衡采样、代价敏感矩阵与代价敏感向量的方法的方式进行训练。重采样和类别均衡采样的方式均为将不同类别的样本采样相同的个数进行训练。该方法在解决类间差异大、类内差异小的不同种类的样本数量不平衡问题上效果较好。然而当类内差异大,即出现少量离群样本时,模型极难学到其样本分布。代价敏感矩阵或代价敏感向量的方法可以通过构建混淆矩阵或代价敏感矩阵,对被错分的类别增大学习率,从而加速模型对离群样本的学习。但当离群样本存在于大样本量类别中时,由于离群样本被抽到的概率微乎其微,该方法的效果几乎可以忽略不计。因此,为了提升离群样本的学习效率,不但要解决类间样本数量不平衡的问题,而且要解决类内样本数量不平衡的问题。而现有技术难以解决上述问题。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于反馈训练的有监督深度学习方法。本专利技术的目的可以通过以 ...
【技术保护点】
1.一种基于反馈训练的有监督深度学习方法,其特征在于,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。
【技术特征摘要】
1.一种基于反馈训练的有监督深度学习方法,其特征在于,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。2.根据权利要求1所述的基于反馈训练的有监督深度学习方法,其特征在于,所述采样概率动态调整的过程具体包括:1)初始化各样本权重参数;2)根据各样本当前的权重参数计算对应的采样概率:其中,P(i)是样本i的采样概率,α为优先级系数,pi为样本i的权重参数;3)进行一次迭代后,获得各样本的预测损失值,基于所述预测损失值更新权重参数;4)在下一次迭代开始时,令pi=p(i),返回步骤2)。3.根据权利要求2所述的基于反馈训练的有监督深度学习方法,其特征在于,所述初始化各样本权重参数时,令各样本权重参数均为1。4.根据权利要求2所...
【专利技术属性】
技术研发人员:杨俊杰,郑军,
申请(专利权)人:聚时科技上海有限公司,
类型:发明
国别省市:上海,31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。