一种基于反馈训练的有监督深度学习方法技术

技术编号:20797738 阅读:24 留言:0更新日期:2019-04-06 11:21
本发明专利技术涉及一种基于反馈训练的有监督深度学习方法,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。与现有技术相比,本发明专利技术通过将有监督学习训练过程中各样本的预测损失值与其自身被采样频率相关联,利用反馈训练的方式实现了调整离群样本被采样到的概率,具有提高训练效果等优点。

A Supervised Deep Learning Method Based on Feedback Training

The present invention relates to a supervised deep learning method based on feedback training. In the process of training supervised deep learning model, each sample in the training set is sampled with a sampling probability at the beginning of each iteration, and the sampling probability is dynamically adjusted with the predicted loss value of each sample. Compared with the prior art, the method has the advantages of improving the training effect by correlating the predicted loss value of each sample in the supervised learning training process with its own sampling frequency, and realizing the adjustment of the probability of the outlier sample being sampled by means of feedback training.

【技术实现步骤摘要】
一种基于反馈训练的有监督深度学习方法
本专利技术涉及深度学习领域,尤其是涉及一种基于反馈训练的有监督深度学习方法。
技术介绍
现在的有监督深度学习方法在使用过程中,需要使用大量的样本数据进行学习,为了降低有监督深度学习模型训练时对硬件的需求,通常采用小批量采样或单样本输入的方式训练模型。通常的采样方式为均匀采样或采用按序输入。在该种情况下,大量的常规样本与小量的离群样本会有相等的概率被送入模型训练,导致模型难以学到小量离群样本的空间分布。当模型的训练目标需要检测或识别小量离群样本时,通过常规采样方式的有监督训练不仅降低了模型的准确率,而且降低了模型的训练速度。为了解决上述问题,现有的解决方式通常为数据重采样、类别均衡采样、代价敏感矩阵与代价敏感向量的方法的方式进行训练。重采样和类别均衡采样的方式均为将不同类别的样本采样相同的个数进行训练。该方法在解决类间差异大、类内差异小的不同种类的样本数量不平衡问题上效果较好。然而当类内差异大,即出现少量离群样本时,模型极难学到其样本分布。代价敏感矩阵或代价敏感向量的方法可以通过构建混淆矩阵或代价敏感矩阵,对被错分的类别增大学习率,从而加速模型对离群样本的学习。但当离群样本存在于大样本量类别中时,由于离群样本被抽到的概率微乎其微,该方法的效果几乎可以忽略不计。因此,为了提升离群样本的学习效率,不但要解决类间样本数量不平衡的问题,而且要解决类内样本数量不平衡的问题。而现有技术难以解决上述问题。
技术实现思路
本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种基于反馈训练的有监督深度学习方法。本专利技术的目的可以通过以下技术方案来实现:一种基于反馈训练的有监督深度学习方法,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。进一步地,所述采样概率动态调整的过程具体包括:1)初始化各样本权重参数;2)根据各样本当前的权重参数计算对应的采样概率:其中,P(i)是样本i的采样概率,α为优先级系数,pi为样本i的权重参数;3)进行一次迭代后,获得各样本的预测损失值,基于所述预测损失值更新权重参数;4)在下一次迭代开始时,令pi=p(i),返回步骤2)。进一步地,所述初始化各样本权重参数时,令各样本权重参数均为1。进一步地,所述基于所述预测损失值更新权重参数具体为:p(i)=|δ(i)|+ε其中,p(i)为更新后的样本i的权重参数,δ(i)为样本i的预测损失值,ε为修正因子。进一步地,所述修正因子ε为一大于0的正数。进一步地,所述预测损失值δ(i)的表达式为:δ(i)=L(yi,f(xi))其中,xi为输入,yi为xi对应的真值标签,函数f为通过输入xi预测标签的函数,函数L为计算真值标签yi与预测标签f(xi)差异的损失函数。进一步地,所述基于所述预测损失值更新权重参数时,权重参数与预测损失值的倒数成正比。与现有技术相比,本专利技术具有以如下有益效果:第一,本专利技术首次提出在有监督深度学习中采用动态调整采样频率的方法,通过增加离群样本被学习的概率以使模型更快地学到整体样本空间分布,从而减少了模型训练时间并可提高模型训练效果。第二,本专利技术可以结合其他采样方式(重采样、类别均衡采样、代价敏感矩阵等方式)以达到效果更好的训练效果。第三,本专利技术可以逆向使用,通过降低离群样本被采样的概率增大模型学习常规样本特征的能力。附图说明图1为本专利技术训练有监督深度学习模型的流程示意图。具体实施方式下面结合附图和具体实施例对本专利技术进行详细说明。本实施例以本专利技术技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本专利技术的保护范围不限于下述的实施例。本专利技术提供一种基于反馈训练的有监督深度学习方法,运行于GPU中,应用于图像处理过程,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。采样概率动态调整的过程具体包括:1)初始化各样本权重参数pi=1;2)根据各样本当前的权重参数计算对应的采样概率:其中,P(i)是样本i的采样概率,pi为样本i的权重参数,α为优先级系数,值越大则代表优先级越大,当α取0时为均匀采样;3)进行一次迭代后,获得各样本的预测损失值,更新权重参数:p(i)=|δ(i)|+ε其中,p(i)为更新后的样本i的权重参数,δ(i)为样本i的预测损失值,ε为修正因子,可以取10-5等很小的正常数,以防止δ(i)=0时x0将不会再被抽样;4)在下一次迭代开始时,令pi=p(i),返回步骤2)。预测损失值δ(i)的表达式为:δ(i)=L(yi,f(xi))其中,xi为输入,yi为xi对应的真值标签,函数f为通过输入xi预测标签的函数,函数L为计算真值标签yi与预测标签f(xi)差异的损失函数。上述方法可以结合其他采样方式(如重采样、类别均衡采样、代价敏感矩阵等方式)以达到效果更好的训练效果。以与类别均衡采样结合为例,从大量的样本类与小量的样本类中分别采集同量的样本,类内采集概率均按权重值计算。上述方法可以逆向使用,通过降低离群样本被采样的概率增大模型学习常规样本特征的能力。例如在使用自动编码器(Auto-encoder)时,其需要学习更多正常标准样本的特征,此时需要采样更多的正常样本,通过将损失值的倒数作为自身权重计算概率时,离群样本会被更少地采样。如图1所示,基于上述采样概率动态调整的有监督深度学习模型训练过程具体为:在步骤401中,预先读入所有图片样本与其对应分类标签的信息;在步骤402中,对所有读入的图像样本信息进行采集权值初始化,初始化值为1;在步骤403中,计算各图像样本的采集概率;在步骤404中,根据各图像样本的采集概率采集图像与其对应的分类标签;在步骤405中,将采集到的图像送入有监督深度学习网络模型训练,并与其损失值;在步骤406中,判断该有监督深度学习网络模型是否达到训练迭代次数上限,若达到上限则终止训练,否则执行步骤407;在步骤407中,利用步骤405计算所得各图像样本的损失值;在步骤408中,更新各样本的权重,完成后执行步骤403。以上详细描述了本专利技术的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本专利技术的构思作出诸多修改和变化。因此,凡本
中技术人员依本专利技术的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。本文档来自技高网
...

【技术保护点】
1.一种基于反馈训练的有监督深度学习方法,其特征在于,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。

【技术特征摘要】
1.一种基于反馈训练的有监督深度学习方法,其特征在于,该方法在训练有监督深度学习模型的过程中,在每次迭代开始时,以一采样概率对训练集中的各样本进行抽样,所述采样概率随各样本的预测损失值动态调整。2.根据权利要求1所述的基于反馈训练的有监督深度学习方法,其特征在于,所述采样概率动态调整的过程具体包括:1)初始化各样本权重参数;2)根据各样本当前的权重参数计算对应的采样概率:其中,P(i)是样本i的采样概率,α为优先级系数,pi为样本i的权重参数;3)进行一次迭代后,获得各样本的预测损失值,基于所述预测损失值更新权重参数;4)在下一次迭代开始时,令pi=p(i),返回步骤2)。3.根据权利要求2所述的基于反馈训练的有监督深度学习方法,其特征在于,所述初始化各样本权重参数时,令各样本权重参数均为1。4.根据权利要求2所...

【专利技术属性】
技术研发人员:杨俊杰郑军
申请(专利权)人:聚时科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1