生成对抗样本的方法及装置制造方法及图纸

技术编号:29837793 阅读:11 留言:0更新日期:2021-08-27 14:27
本说明书实施例提供一种生成对抗样本的方法和装置,其中方法包括,首先获取目标风险样本的原始样本特征以及风险检测模型。针对该目标风险样本,在预定特征空间中,确定预定数目T个基准方向;依次按照T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,其中风险检测模型针对该第一变换特征的预测值落入非风险样本对应的预定区间。然后,针对该第一变换特征,沿最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,该风险检测模型针对第二变换特征的预测值达到前述预定区间的边界。于是,可以根据该第二变换特征,形成目标风险样本对应的对抗样本。

【技术实现步骤摘要】
生成对抗样本的方法及装置
本说明书一个或多个实施例涉及机器学习领域,尤其涉及生成对抗样本的方法和装置。
技术介绍
机器学习的迅猛发展使得各种机器学习的模型在各种各样的业务场景得到应用。例如在安全和风控场景中,已经通过机器学习训练出一些风险检测模型,用于识别出有风险或有安全隐患的对象。例如,通过风险检测模型识别垃圾账号,识别高风险的交易,识别高风险操作,等等。在识别出这样的风险对象后往往会对其进行拦截,以确保系统和用户的安全。鉴于已有的风险检测模型常常在鲁棒性方面存在不足,希望能有改进的方案,可以针对风险检测模型进行优化,以提升其鲁棒性,更好地适用于风险检测场景中的攻防特点。
技术实现思路
本说明书一个或多个实施例描述了一种生成对抗样本的方法和装置,可以模拟攻击者生成的对抗样本,从而可以利用这样的对抗样本,从攻防对抗的角度对风险检测模型进行优化,增强其鲁棒性和安全性。根据第一方面,提供了一种生成对抗样本的方法,包括:获取目标风险样本的原始样本特征以及风险检测模型;在预定特征空间中,确定预定数目T个基准方向;针对所述原始样本特征,依次按照所述T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,所述风险检测模型针对所述第一变换特征的预测值落入非风险样本对应的预定区间;针对所述第一变换特征,沿所述若干次特征变换中最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,所述风险检测模型针对第二变换特征的预测值达到所述预定区间的边界;所述回退幅度小于所述第一步长;根据所述第二变换特征,形成所述目标风险样本对应的对抗样本。在一个实施例中,所述T个基准方向在所述特征空间中彼此正交。根据一种实施方式,所述若干轮特征变换中的第t轮特征变换包括:获取第t个基准方向;以上一轮得到的特征作为当前特征,基于当前特征,以所述第一步长,按照所述第t个基准方向进行特征变换,得到中间特征;在所述风险检测模型针对所述中间特征的第一预测值相较于针对当前特征的第二预测值更加远离风险标签值的情况下,用所述中间特征更新当前特征。在上述实施方式的一个实施例中,按照所述第t个基准方向进行特征变换,得到中间特征,具体包括:分别将正向和反向作为选定方向;沿着所述第t个基准方向的选定方向,在当前特征上叠加大小为第一步长的扰动变换,将得到的特征作为所述中间特征。在上述实施方式的另一个实施例中,按照所述第t个基准方向进行特征变换,得到中间特征,具体包括:分别将正向和反向作为选定方向;沿着所述第t个基准方向的选定方向,在当前特征上叠加大小为第一步长的扰动变换,得到临时特征;如果所述临时特征相对于所述原始样本特征的变换大小超出预定变换边界,则通过预设投影函数,将所述临时特征投影到所述预定变换边界之内,作为所述中间特征。在上述实施方式的一个实施例中,所述第t轮特征变换还包括:判断所述风险检测模型针对更新后的当前特征的预测值是否落入所述预定区间;若没有落入所述预定区间,则进入下一轮特征变换;若落入所述预定区间,则将所述当前特征作为所述第一变换特征。根据一种实施方式,所述若干次回退操作中的第i次回退操作包括:确定本次回退幅度;沿所述最后一次特征变换方向的逆向,基于所述第一变换特征回退所述本次回退幅度,得到中间特征;在所述风险检测模型针对所述中间特征的第一预测值,相较于针对前次记录的当前特征的第二预测值更加接近风险标签值的情况下,用所述中间特征更新该当前特征。在上述实施方式的一个实施例中,确定本次回退幅度,包括:在上一次回退操作的回退幅度上,叠加预定的第二步长,得到本次回退幅度。在上述实施方式的又一实施例中,确定本次回退幅度,包括:在上一次回退操作的回退系数上乘以预设的衰减系数,作为本次回退系数;所述衰减系数小于1;确定1减去本次回退系数的差值,将该差值与第一步长的乘积作为本次回退幅度。在上述实施方式的一个实施例中,基于所述第一变换特征回退所述本次回退幅度,得到中间特征,具体包括:在所述第一变换特征上消减所述本次回退幅度,得到临时特征;如果所述临时特征相对于所述原始样本特征的变换大小没有超出预定变换边界,则将该临时特征作为中间特征;如果所述临时特征超出所述预定变换边界,则通过预设投影函数,将所述临时特征投影到所述预定变换边界之内,作为所述中间特征。根据一个实施例,所述若干次回退操作中的第i次回退操作还包括:判断所述风险检测模型针对所述中间特征的第一预测值是否属于所述预定区间;若属于所述预定区间,则进入下一次回退操作;若不属于所述预定区间,则将上一次记录的当前特征作为所述第二变换特征。根据一种实施方式,所述预定特征空间是根据预定映射关系,将所述原始样本特征对应的高维特征空间进行降维映射得到的低维特征空间;相应的,所述根据所述第二变换特征,形成所述目标风险样本对应的对抗样本,包括:根据所述预定映射关系的逆映射,将处于所述预定特征空间的第二变换特征,映射回所述高维特征空间,作为所述对抗样本的样本特征。在不同例子中,所述样本为以下之一:账号、交易、文本片段、用户操作。根据第二方面,提供了一种优化风险检测模型的方法,包括:获取原始样本构成的样本集,其中包括正常样本和风险样本;获取根据第一方面的方法针对所述风险样本生成的对抗样本;利用所述样本集中各个原始样本和各个对抗样本,更新风险检测模型。根据第三方面,提供了一种生成对抗样本的方法,包括:获取目标样本的原始样本特征以及分类模型,所述目标样本对应于第一类别;在预定特征空间中,确定预定数目T个基准方向;针对所述原始样本特征,依次按照所述T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,所述分类模型针对所述第一变换特征的预测值落入非第一类别的样本对应的预定区间;针对所述第一变换特征,沿所述若干次特征变换中最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,所述分类模型针对第二变换特征的预测值达到所述预定区间的边界;所述回退幅度小于所述第一步长;根据所述第二变换特征,形成所述目标样本对应的对抗样本。根据第四方面,提供了一种生成对抗样本的装置,包括:获取单元,配置为获取目标风险样本的原始样本特征以及风险检测模型;基准方向确定单元,配置为在预定特征空间中,确定预定数目T个基准方向;特征变换单元,配置为针对所述原始样本特征,依次按照所述T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,所述风险检测模型针对所述第一变换特征的预测值落入非风险样本对应的预定区间;回退操作单元,配置为针对所述第一变换特征,沿所述若干次特征变换中最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,所述风险检测本文档来自技高网...

【技术保护点】
1.一种生成对抗样本的方法,包括:/n获取目标风险样本的原始样本特征以及风险检测模型;/n在预定特征空间中,确定预定数目T个基准方向;/n针对所述原始样本特征,依次按照所述T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,所述风险检测模型针对所述第一变换特征的预测值落入非风险样本对应的预定区间;/n针对所述第一变换特征,沿所述若干次特征变换中最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,所述风险检测模型针对第二变换特征的预测值达到所述预定区间的边界;所述回退幅度小于所述第一步长;/n根据所述第二变换特征,形成所述目标风险样本对应的对抗样本。/n

【技术特征摘要】
1.一种生成对抗样本的方法,包括:
获取目标风险样本的原始样本特征以及风险检测模型;
在预定特征空间中,确定预定数目T个基准方向;
针对所述原始样本特征,依次按照所述T个基准方向中的不同基准方向,以预设的第一步长,执行若干轮特征变换,直到得到第一变换特征,所述风险检测模型针对所述第一变换特征的预测值落入非风险样本对应的预定区间;
针对所述第一变换特征,沿所述若干次特征变换中最后一次特征变换方向的逆向,以依次增大的回退幅度执行若干次回退操作,直到得到第二变换特征,所述风险检测模型针对第二变换特征的预测值达到所述预定区间的边界;所述回退幅度小于所述第一步长;
根据所述第二变换特征,形成所述目标风险样本对应的对抗样本。


2.根据权利要求1所述的方法,其中,所述T个基准方向在所述特征空间中彼此正交。


3.根据权利要求1所述的方法,其中,所述若干轮特征变换中的第t轮特征变换包括:
获取第t个基准方向;
以上一轮得到的特征作为当前特征,基于当前特征,以所述第一步长,按照所述第t个基准方向进行特征变换,得到中间特征;
在所述风险检测模型针对所述中间特征的第一预测值相较于针对当前特征的第二预测值更加远离风险标签值的情况下,用所述中间特征更新当前特征。


4.根据权利要求3所述的方法,其中,按照所述第t个基准方向进行特征变换,得到中间特征,包括:
分别将正向和反向作为选定方向;
沿着所述第t个基准方向的选定方向,在当前特征上叠加大小为第一步长的扰动变换,将得到的特征作为所述中间特征。


5.根据权利要求3所述的方法,其中,按照所述第t个基准方向进行特征变换,得到中间特征,包括:
分别将正向和反向作为选定方向;
沿着所述第t个基准方向的选定方向,在当前特征上叠加大小为第一步长的扰动变换,得到临时特征;
如果所述临时特征相对于所述原始样本特征的变换大小超出预定变换边界,则通过预设投影函数,将所述临时特征投影到所述预定变换边界之内,作为所述中间特征。


6.根据权利要求3所述的方法,其中,所述第t轮特征变换还包括:
判断所述风险检测模型针对更新后的当前特征的预测值是否落入所述预定区间;
若没有落入所述预定区间,则进入下一轮特征变换;
若落入所述预定区间,则将所述当前特征作为所述第一变换特征。


7.根据权利要求1所述的方法,其中,所述若干次回退操作中的第i次回退操作包括:
确定本次回退幅度;
沿所述最后一次特征变换方向的逆向,基于所述第一变换特征回退所述本次回退幅度,得到中间特征;
在所述风险检测模型针对所述中间特征的第一预测值,相较于针对前次记录的当前特征的第二预测值更加接近风险标签值的情况下,用所述中间特征更新该当前特征。


8.根据权利要求7所述的方法,其中,确定本次回退幅度,包括:
在上一次回退操作的回退幅度上,叠加预定的第二步长,得到本次回退幅度。


9.根据权利要求7所述的方法,其中,确定本次回退幅度,包括:
在上一次回退操作的回退系数上乘以预设的衰减系数,作为本次回退系数;所述衰减系数小于1;
确定1减去本次回退系数的差值,将该差值与第一步长的乘积作为本次回退幅度。


10.根据权利要求7所述的方法,其中,基于所述第一变换特征回退所述本次回退幅度,得到中间特征,包括:
在所述第一变换特征上消减所述本次回退幅度,得到临时特征;
如果所述临时特征相对于所述原始样本特征的变换大小没有超出预定变换边界,则将该临时特征作为中间特征;
如果所述临时特征超出所述预定变换边界,则通过预设投影函数,将所述临时特征投影到所述预定变换边界之内,作为所述中间特征。


11.根据权利要求7所述的方法,其中,所述若干次回退操作中的第i次回退操作还包括:
判断所述风险检测模型针对所述中间特征的第一预测值是否属于所述预定区间;
若属于所述预定区间,则进入下一次回退操作;
若不属于所述预定区间,则将上一次记录的当前特征作为所述第二变换特征。

<...

【专利技术属性】
技术研发人员:李辉吴若凡李志峰崔世文孟昌华王维强
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1