机器学习模型的对抗训练制造技术

技术编号：33849998 阅读：16 留言：0更新日期：2022-06-18 10:35

本文档涉及诸如神经网络之类的机器学习模型的训练。一种示例方法包括提供具有一个或多个层以及相关联的参数的机器学习模型，以及对机器学习模型的参数执行预训练阶段以获得经预训练的参数。该示例方法还包括通过使用经标注的训练样本对机器学习模型执行调节阶段，以调节经预训练的参数。调节阶段可以包括执行对经标注的训练示例的噪声调整，以获得经噪声调整的训练样本。调节阶段还可以包括至少基于经标注的训练示例和经噪声调整的训练示例来调整经预训练的参数，以获得经适配的参数。该示例方法还可以包括输出具有经适配的参数的经调节的机器学习模型。经调节的机器学习模型。经调节的机器学习模型。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】机器学习模型的对抗训练

技术介绍

[0001]机器学习可以用于执行广泛的任务，诸如自然语言处理、金融分析和图像处理。机器学习模型可以使用若干方法被训练，诸如监督学习、半监督学习、无监督学习、强化学习等。在诸如监督或半监督学习之类的方法中，可以使用经标注的训练示例来训练模型，以将输入映射到输出。然而，对于许多机器学习任务，经标注的训练数据是有限数量的。

技术实现思路

[0002]提供本
技术实现思路
是为了以简化的形式介绍将在以下详细描述中进一步描述的一些构思。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征，也不旨在用于限制所要求保护的主题的范围。
[0003]本描述总体上涉及用于训练机器学习模型的技术。一个示例包括一种可以在计算设备上被执行的方法或技术。该方法或技术可以包括提供具有一个或多个层以及相关联的参数的机器学习模型。该方法或技术还可以包括对机器学习模型的参数执行预训练阶段，以获得经预训练的参数。该方法或技术还可以包括通过使用经标注的训练样本对机器学习模型执行调节阶段，以调节经预训练的参数。调节阶段可以包括执行对经标注的训练样本的噪声调整以获得经噪声调整的训练样本，以及至少基于经标注的训练样本和经噪声调整的训练样本来调整经预训练的参数，以获得经适配的参数。该方法或技术还可以包括输出具有经适配的参数的经调节的机器学习模型。
[0004]另一示例包括一种系统，该系统具有硬件处理单元和存储计算机可读指令的存储资源。当由硬件处理单元执行时，该计算机可读指令可以使硬件处理单元：接收输入数据，使用具有第一层...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种在计算设备上被执行的方法，所述方法包括：提供机器学习模型，所述机器学习模型具有一个或多个层以及相关联的参数；对所述机器学习模型的所述参数执行预训练阶段，以获得经预训练的参数；通过使用经标注的训练样本对所述机器学习模型执行调节阶段，以调节所述经预训练的参数，所述调节阶段包括：执行对所述经标注的训练样本的噪声调整，以获得经噪声调整的训练样本，以及至少基于所述经标注的训练样本和所述经噪声调整的训练样本来调整所述经预训练的参数，以获得经适配的参数；以及输出具有所述经适配的参数的经调节的机器学习模型。2.根据权利要求1所述的方法，其中所述调整包括计算损失函数，所述损失函数包括：第一项，所述第一项与所述机器学习模型的预测和所述经标注的训练样本的标签之间的差异成比例；以及第二项，所述第二项与所述机器学习模型的针对所述经标注的训练样本的输出和所述机器学习模型的针对所述经噪声调整的训练样本的输出之间的差异成比例。3.根据权利要求1所述的方法，其中所述调节阶段包括多次调节迭代，所述方法还包括：确定所述机器学习模型的当前迭代的输出与所述机器学习模型的至少一次先前迭代的输出之间的差异；以及至少基于所述差异来约束所述参数的所述调整。4.根据权利要求3所述的方法，其中所述调整包括：至少基于所述经噪声调整的训练样本来执行对抗正则化，以及至少基于所述差异来执行所述参数的邻近点更新。5.根据权利要求1所述的方法，还包括：在所述调节阶段之后，使用所述经调节的机器学习模型对输入数据执行特定任务。6.根据权利要求1所述的方法，其中所述机器学习模型包括一个或多个嵌入层和至少一个任务特定层。7.根据权利要求6所述的方法，其中所述一个或多个嵌入层包括词典编码器或变换器编码器。8.根据权利要求6所述...

【专利技术属性】
技术研发人员：刘晓东，高剑峰，贺鹏程，陈伟柱，
申请(专利权)人：微软技术许可有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人