一种基于元学习器逐步梯度校正的元学习算法制造技术

技术编号:21433602 阅读:18 留言:0更新日期:2019-06-22 12:20
一种基于元学习器逐步梯度校正的元学习算法,首先,获取有噪音标记的训练数据以及少量干净无偏的元数据集;相对于在训练数据集上建立的分类器即学生网络,在元数据集上建立一个元学习器即老师网络;利用随机梯度下降联合更新学生网络和老师网络参数。即通过学生网络梯度下降格式得到学生网络参数梯度更新函数;将其反馈给老师网络,并利用元数据得到老师网络参数更新,从而得到矫正的学生网络参数梯度格式;然后利用此矫正格式完成学生网络参数更新。据此,学生网络参数能够在矫正的方向上实现更好的学习,减弱了对噪音标记的过拟合问题。本发明专利技术具有易于用户理解、实现和可解释性等特点,能够鲁棒的适用于蕴含噪声标记的实际数据场景。

【技术实现步骤摘要】
一种基于元学习器逐步梯度校正的元学习算法
本专利技术属于深度神经网络
,涉及元学习算法,特别涉及一种基于元学习器逐步梯度校正的元学习算法。
技术介绍
深度神经网络由于其对复杂输入模式的强大建模能力,最近在不同的应用当中取得了引人瞩目的应用效果。尽管如此,深度神经网络很容易在包含噪音标注的训练数据上过拟合,从而在预测过程中出现泛化较差的问题。在实践中,这一噪音标注的鲁棒学习问题往往由于高质量标注的匮乏而难以避免。典型的例子如利用众包系统或者搜索引擎进行数据收集时,往往会产生大量的错误标记,从而导致低质量的训练数据。所以对蕴含噪音标记的数据进行有效的学习是机器学习领域一个十分重要而富有挑战的问题。样本重加权方法是解决这个问题最常使用的方法。其核心方法论为针对具体的任务和模型对样本设计合适的加权机制,从而对干净标注样本的作用进行增强,对错误标注样本的负面影响进行压制。早期的方法通过利用合适的先验知识嵌入模型从而获得样本权重,然后极小化训练样本的加权损失,从而获得鲁棒的学习效果。然而,这种模式过于依赖先验,不具有数据的灵活性与针对性。之后,多个在学习过程中动态更新样本权值的重加权方法被提出,其主要的加权信息来源于训练过程中样本的损失值。这类方法主要可以分为两类。第一类方法更多强调更大损失的样本,这是由于此类样本更可能是位于分类边界的难样本,其可能包含更多区分类别的信息。典型的方法包含AdaBoost,hardnegativemining,focalloss等。另一类方法认为具有更小损失的样本更重要,因为其更可能是拥有干净标记的高置信度样本。典型的方法包括自步学习,迭代重加权等。这种动态加权的方法相比于预设的加权方法,具有更加灵活和合理的特点。但是这些方法仍然需要具体的假设去构建模型,不可避免的存在超参数需预设的调参问题。这显著增加了这些方法处理现实问题的困难性。最近,元学习技术成为处理这类问题一种新的方式。该方法首先需要收集少量无偏的具有干净标签的元数据集用来模拟正确的数据样本-标签分布,作为潜在元知识的代表性信息;然后同时设计针对噪音标注训练数据集上的学生网络(分类器),及其在元数据集上的老师网络(元学习器)。然后通过教学生网络与老师网络参数互相进行反馈改善,交叉迭代,从而达到教学互长的学习目的。采用这种元学习模式,超参数的学习将被有效嵌入到学习过程中进行自动化确定与调整,从而实现了自动化调参与鲁棒性学习的目标。然而为了保证很强的超参数学习能力,当前的方法一般需要构造很复杂的元学习器。这降导致这些元学习算法很难理解和难于重现。
技术实现思路
为了克服当前元学习技术的缺点,本专利技术的目的在于提供一种基于元学习器逐步梯度校正(ProgressiveGradientCorrectingbyMeta-learner,简称Meta-PGC)的元学习算法,是一种在有噪音标记的数据集上训练深度网络的鲁棒学习方法,对当前的元学习算法进行增强改进,使得新的元学习算法具有易于用户理解、实现和可解释性等特点。为了实现上述目的,本专利技术采用的技术方案是:一种基于元学习器逐步梯度校正的元学习算法,包括如下步骤:步骤S1:获取训练数据集以及元数据集其中xi,yi表示第i个训练数据及其对应的标签,表示第i个元数据及其对应的标签,N为训练数据尺寸,M为元数据尺寸,M<<N,设定批尺寸大小n<N,m<M。所述训练数据指含有噪音标记的脏数据,元数据为少量的无偏的干净数据,旨在代表潜在真实数据-标签分布的元知识。设置最大迭代次数T;步骤S2:相对于在训练数据集上建立的分类器,即学生网络f(x;w),在元数据集上建立一个元学习器,即老师网络其中x表示分类器的输入(训练数据),w是学生网络的参数,是老师网络的输入(第i个训练数据的损失值),l是分类损失,Θ是老师网络的参数。初始化学生网络模型参数w(0)和老师网络模型参数Θ(0)。步骤S3:分别从训练数据集D和元数据集随机选取Mini-Batch数据样本:SampleMiniBatch(D;n)和步骤S4:利用SampleMiniBatch(D;n)使用随机梯度下降策略,获得学生网络参数更新函数公式;步骤S5:利用使用随机梯度下降策略,更新老师网络参数;步骤S6:根据老师网络输出的权值,重新利用SampleMiniBatch(D;n),利用学生网络参数更新函数公式,更新学生网络参数;步骤S7:重复步骤S3-S6,经过T次停机,输出学生网络及参数。所述步骤S2中,学生网络指在训练数据集D上希望学习得到的分类器,其可以是任何形式的机器学习模型,在这里设置为目前复杂分类问题常用的深度网络模型;老师网络试图通过元学习的学习方式,自动学习加权函数的参数,避免手动设计加权函数和参数预设的问题。不同于当前元学习中元学习器需要较为复杂的结构,老师网络(即元学习器)结构要求十分简单,一般取包含100个节点的单隐层MLP网络,即1-100-1的结构,每个隐层节点的激活函数设置为ReLU函数,输出节点的激活函数设置为Sigmoid函数,以保证输出范围在[0,1]之间。在训练数据集D上极小化期望损失函数以获取学生网络f(x;w)最优的网络参数W*,当训练数据集D的标签包含噪音,通过对每个数据样本嵌入加权函数即老师网络则学生网络的最优参数通过极小化如下加权损失获得:所述老师网络最优的参数Θ*通过在元数据集上极小化如下元损失函数获得:其中所述步骤S3,学生网络和老师网络通过随机梯度下降进行更新,算法在每次重复S3-S6过程中,从总的训练数据集D里面随机选取mini-batch的数据样本进行学习。所述步骤S4中,为了更新学生网络,需要计算公式(1)中W*的梯度,然后通过梯度下降策略改善学生网络,当使用随机梯度下降策略,且每次迭代选取mini-batch训练数据样本{(xi,yi),1≤i≤n},n<<N是批尺寸大小时,得到以老师网络参数Θ为自变量的学生网络参数更新函数公式如下:其中α是步长,w(t)表示迭代t步学生网络参数。所述步骤S5中,为了更新老师网络,当老师网络接收到学生网络的更新参数计算公式(2)中Θ*的梯度,然后通过梯度下降策略改善老师网络,当使用随机梯度下降时,每次迭代选取mini-batch训练数据样本m<<M是批尺寸大小时,老师网络参数更新为:其中β是步长,Θ(t)表示迭代t步老师网络参数。所述步骤S6中,更新的老师网络输出的权重传输到公式(3)的用来矫正梯度重新更新学生网络参数:公式(3)和公式(5)w(t+1)可以直接通过自动可微的技术计算,Θ(t+1)的计算可以根据如下推导:其中,将公式(6)(7)代入公式(4),可以得到老师网络参数更新为:所述公式(8)中更新网络参数,梯度包含两部分:和其中可以直接利用自动求导技术计算;对于如果学生网络是传统的分类器,如SVM等,则可以直接计算;如果是深度网络,则采用如下的方法近似计算:具体地,考虑如下损失函数:其中,∈=(∈1,∈2,…,∈n)是扰动变量,则对w进行一步梯度更新有:同样的,最优的∈可以通过极小化下面的损失函数得到:进行如下推导,有:公式(14)可以通过对公式(11)对∈j进行一步梯度更新得到:其中,γ是下降步长,最终得到以下近似计算:对公式(16本文档来自技高网
...

【技术保护点】
1.一种基于元学习器逐步梯度校正的元学习算法,其特征在于,包括如下步骤:步骤S1:获取训练数据集

【技术特征摘要】
1.一种基于元学习器逐步梯度校正的元学习算法,其特征在于,包括如下步骤:步骤S1:获取训练数据集以及元数据集其中xi表示第i个训练数据,yi表示xi对应的标签,表示第i个元数据,表示对应的标签,N为训练数据尺寸,M为元数据尺寸,M<<N,设定批尺寸大小n<N,m<M,所述训练数据指含有噪音标记的脏数据,元数据为少量的无偏的干净数据,旨在代表潜在真实数据-标签分布的元知识,设置最大迭代次数T;步骤S2:相对于在训练数据集上建立的分类器,即学生网络f(x;w),在元数据集上建立一个元学习器,即老师网络其中x表示分类器的输入,即训练数据,w是学生网络的参数,是老师网络的输入,即第i个训练数据的损失值,l是分类损失,Θ是老师网络的参数,初始化学生网络模型参数w(0)和老师网络模型参数Θ(0);步骤S3:分别从训练数据集D和元数据集随机选取Mini-Batch数据:SampleMiniBatch(D;n)和步骤S4:利用SampleMiniBatch(D;n)使用随机梯度下降策略,获得学生网络参数更新函数公式;步骤S5:利用使用随机梯度下降策略,更新老师网络参数;步骤S6:根据老师网络输出的权值,重新利用SampleMiniBatch(D;n),利用学生网络参数更新函数公式,更新学生网络参数;步骤S7:重复步骤S3-S6,经过T次停机,输出学生网络及参数。2.根据权利要求1所述基于元学习器逐步梯度校正的元学习算法,其特征在于,所述步骤S2中,学生网络指在训练数据集D上希望学习得到的分类器;老师网络试图通过元学习的学习方式,自动学习加权函数的参数,避免手动设计加权函数和参数预设的问题。3.根据权利要求2所述基于元学习器逐步梯度校正的元学习算法,其特征在于,所述学生网络为深度网络模型,不同于当前元学习中元学习器需要较为复杂的结构,所述老师网络取包含100个节点的单隐层MLP网络,即1-100-1的结构,每个隐层节点的激活函数设置为ReLU函数,输出节点的激活函数设置为Sigmoid函数,以保证输出范围在[0,1]之间。4.根据权利要求1所述基于元学习器逐步梯度校正的元学习算法,其特征在于,在训练数据集D上极小化期望损失函数以获取学生网络f(x;w)最优的网络参数w*,当训练数据集D的标签包含噪音,通过对每个数据样本嵌入加权函数即老...

【专利技术属性】
技术研发人员:孟德宇束俊徐宗本
申请(专利权)人:西安交通大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1