减轻机器学习系统中的对抗效应技术方案

技术编号：33343285 阅读：15 留言：0更新日期：2022-05-08 09:31

提供用于净化机器学习(ML)模型的技术。接收第一ML模型以及干净的训练数据。使用干净的训练数据训练第一ML模型与第二ML模型之间的路径。基于经训练的路径上的至少一个点，生成经净化的ML模型。然后，使用经净化的ML模型促进一个或多个ML功能。进一个或多个ML功能。进一个或多个ML功能。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】减轻机器学习系统中的对抗效应

[0001]本公开涉及机器学习，并且更具体地，涉及减轻机器学习系统中的对抗效应。

技术介绍

[0002]各种机器学习模型和技术已经被应用于各种应用中，并且继续显示巨大的潜力。然而，许多模型需要大量的训练数据以便返回满意的结果。获得这些数据通常是困难、昂贵和耗时的。为了减少这些负担，许多都依赖于预先训练的模型或预先标记的训练数据。然而，这些模型和数据相对未知，并且可能被污染或中毒。例如，训练数据可能被与目标标签相关联的指定触发器模式破坏。在训练期间，这些模型结合了该对抗性行为，以使得当存在指定触发器时，这些模型可能被欺骗或被迫将输入数据错误地分类到目标类别中。其它攻击也是可能的。
[0003]尽管现有的解决方案通常通过执行一些附加的调整或细化来定制预先训练的模型，但是，在这一阶段可用的训练数据通常相当少，并且不足以完全训练新的模型。这使得模型对于预先训练的篡改(例如，使用触发器)具有强的偏差。通常，这些对抗性偏差难以检测或者不可能检测。因此，需要净化或修复可能被污染的模型，而无需大量的附加数据或者模型的完整重新训练。

技术实现思路

[0004]根据本公开的一个实施例，提供了一种方法。该方法包括接收第一机器学习(ML)模型和干净的训练数据。该方法进一步包括由计算设备使用干净的训练数据来训练第一ML模型与第二ML模型之间的路径。然后，基于经训练的路径上的至少一个点，生成经净化的ML模型。该方法还包括使用经净化的ML模型促进一个或多个ML功能。有利地，这种方法使得ML模型...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种方法，包括：接收第一机器学习ML模型；接收干净的训练数据；由计算设备使用所述干净的训练数据来训练所述第一ML模型与第二ML模型之间的路径；基于经训练的路径上的至少一个点，生成经净化的ML模型；以及使用所述经净化的ML模型促进一个或多个ML功能。2.根据权利要求1所述的方法，其中，使用有毒的训练数据来预先训练所述第一ML模型，以使得所述第一ML模型对具有预定义触发器的对抗性输入数据进行错误分类，并且其中，所述经净化的ML模型相对不太可能对所述对抗性输入数据进行错误分类。3.根据权利要求1所述的方法，其中，生成经净化的ML模型包括：确定所述经净化的ML模型的预定义可接受准确度；选择所述经训练的路径上的与所述第一ML模型相距最远且满足所述预定义可接受准确度的点；以及基于在所选择的点处指定的权重，实例化所述经净化的ML模型。4.根据权利要求1所述的方法，其中，从第三方接收所述第一ML模型和所述第二ML模型，并且其中，用于训练所述第一ML模型和所述第二ML模型的训练数据未被接收。5.根据权利要求1所述的方法，所述方法进一步包括：通过使用所述干净的训练数据迭代地细化所述第一ML模型，生成所述第二ML模型。6.根据权利要求1所述的方法，其中，训练所述第一ML模型与所述第二ML模型之间的所述路径包括：确定对应于所述第一ML模型的第一组权重w1；确定对应于所述第二ML模型的第二组权重w2；以及生成具有参数θ的连续分段平滑参数曲线φ
θ
(t)，以使得φ
θ
(0)＝w1并且φ
θ
(1)＝w2。7.根据权利要求6所述的方法，其中，生成所述连续分段平滑参数曲线包括：确定所述参数θ，其包括：最小化在由定义的曲线上的均匀分布的期望。8.根据权利要求1所述的方法，其中，所述第一ML模型是在第一训练数据集上进行训练的，其中，所述第一训练数据集不包括所述干净的训练数据，并且其中，所述第一训练数据集大于所述干净的训练数据。9.一种包含计算机程序代码的计算机可读存储介质，所述计算机程序代码在由一个或多个计算机处理器的操作执行时执行操作，所述操作包括：接收第一机器学习ML模型；接收干净的训练数据；使用所述干净的训练数据来训练所述第一ML模型和第二ML模型之间的路径；基于经训练的路径上的至少一个点，生成经净化的ML模型；以及使用所述经净化的ML模型促进一个或多个ML功能。10.根据权利要求9所述的计算机可读存储介质，其中，使用有毒的训练数据来预先训
练所述第一ML模型，以使得所述第一ML模型对具有预定义触发器的对抗性输入数据进行错误分类，并且其中，所述净化ML模型相对不太可能对所述对抗性输入数据进行错误分类。11.根据权利要求9所述的计算机可读存储介质，其中，生成所述经净化的ML模型包括：确定所述经净化的M...

【专利技术属性】
技术研发人员：陈品谕，P，
申请(专利权)人：国际商业机器公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人