一种基于元学习器逐步梯度校正的元学习算法制造技术

技术编号：21433602 阅读：18 留言：0更新日期：2019-06-22 12:20

一种基于元学习器逐步梯度校正的元学习算法，首先，获取有噪音标记的训练数据以及少量干净无偏的元数据集；相对于在训练数据集上建立的分类器即学生网络，在元数据集上建立一个元学习器即老师网络；利用随机梯度下降联合更新学生网络和老师网络参数。即通过学生网络梯度下降格式得到学生网络参数梯度更新函数；将其反馈给老师网络，并利用元数据得到老师网络参数更新，从而得到矫正的学生网络参数梯度格式；然后利用此矫正格式完成学生网络参数更新。据此，学生网络参数能够在矫正的方向上实现更好的学习，减弱了对噪音标记的过拟合问题。本发明专利技术具有易于用户理解、实现和可解释性等特点，能够鲁棒的适用于蕴含噪声标记的实际数据场景。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于元学习器逐步梯度校正的元学习算法
本专利技术属于深度神经网络
，涉及元学习算法，特别涉及一种基于元学习器逐步梯度校正的元学习算法。
技术介绍
深度神经网络由于其对复杂输入模式的强大建模能力，最近在不同的应用当中取得了引人瞩目的应用效果。尽管如此，深度神经网络很容易在包含噪音标注的训练数据上过拟合，从而在预测过程中出现泛化较差的问题。在实践中，这一噪音标注的鲁棒学习问题往往由于高质量标注的匮乏而难以避免。典型的例子如利用众包系统或者搜索引擎进行数据收集时，往往会产生大量的错误标记，从而导致低质量的训练数据。所以对蕴含噪音标记的数据进行有效的学习是机器学习领域一个十分重要而富有挑战的问题。样本重加权方法是解决这个问题最常使用的方法。其核心方法论为针对具体的任务和模型对样本设计合适的加权机制，从而对干净标注样本的作用进行增强，对错误标注样本的负面影响进行压制。早期的方法通过利用合适的先验知识嵌入模型从而获得样本权重，然后极小化训练样本的加权损失，从而获得鲁棒的学习效果。然而，这种模式过于依赖先验，不具有数据的灵活性与针对性。之后，多个在学习过程中动态更新样本权值的重加权方法被提出，其主要的加权信息来源于训练过程中样本的损失值。这类方法主要可以分为两类。第一类方法更多强调更大损失的样本，这是由于此类样本更可能是位于分类边界的难样本，其可能包含更多区分类别的信息。典型的方法包含AdaBoost,hardnegativemining,focalloss等。另一类方法认为具有更小损失的样本更重要，因为其更可能是拥有干净标记的高置信度样本。典型的方法包括自步...

【技术保护点】
1.一种基于元学习器逐步梯度校正的元学习算法，其特征在于，包括如下步骤：步骤S1：获取训练数据集

【技术特征摘要】
1.一种基于元学习器逐步梯度校正的元学习算法，其特征在于，包括如下步骤：步骤S1：获取训练数据集以及元数据集其中xi表示第i个训练数据，yi表示xi对应的标签，表示第i个元数据，表示对应的标签，N为训练数据尺寸，M为元数据尺寸，M＜＜N，设定批尺寸大小n＜N，m＜M，所述训练数据指含有噪音标记的脏数据，元数据为少量的无偏的干净数据，旨在代表潜在真实数据-标签分布的元知识，设置最大迭代次数T；步骤S2：相对于在训练数据集上建立的分类器，即学生网络f(x；w)，在元数据集上建立一个元学习器，即老师网络其中x表示分类器的输入，即训练数据，w是学生网络的参数，是老师网络的输入，即第i个训练数据的损失值，l是分类损失，Θ是老师网络的参数，初始化学生网络模型参数w(0)和老师网络模型参数Θ(0)；步骤S3：分别从训练数据集D和元数据集随机选取Mini-Batch数据：SampleMiniBatch(D；n)和步骤S4：利用SampleMiniBatch(D；n)使用随机梯度下降策略，获得学生网络参数更新函数公式；步骤S5：利用使用随机梯度下降策略，更新老师网络参数；步骤S6：根据老师网络输出的权值，重新利用SampleMiniBatch(D；n)，利用学生网络参数更新函数公式，更新学生网络参数；步骤S7：重复步骤S3-S6，经过T次停机，输出学生网络及参数。2.根据权利要求1所述基于元学习器逐步梯度校正的元学习算法，其特征在于，所述步骤S2中，学生网络指在训练数据集D上希望学习得到的分类器；老师网络试图通过元学习的学习方式，自动学习加权函数的参数，避免手动设计加权函数和参数预设的问题。3.根据权利要求2所述基于元学习器逐步梯度校正的元学习算法，其特征在于，所述学生网络为深度网络模型，不同于当前元学习中元学习器需要较为复杂的结构，所述老师网络取包含100个节点的单隐层MLP网络，即1-100-1的结构，每个隐层节点的激活函数设置为ReLU函数，输出节点的激活函数设置为Sigmoid函数，以保证输出范围在[0，1]之间。4.根据权利要求1所述基于元学习器逐步梯度校正的元学习算法，其特征在于，在训练数据集D上极小化期望损失函数以获取学生网络f(x；w)最优的网络参数w*，当训练数据集D的标签包含噪音，通过对每个数据样本嵌入加权函数即老...

【专利技术属性】
技术研发人员：孟德宇，束俊，徐宗本，
申请(专利权)人：西安交通大学，
类型：发明
国别省市：陕西,61

全部详细技术资料下载我是这个专利的主人