本说明书实施例提供一种基于隐私保护的模型训练方法及装置,获得用于训练目标业务模型的初始事件序列集合;针对所述初始事件序列集合中的各初始事件序列,根据第一增强策略的策略信息,基于预设的用于进行数据扰动修改的多个数据增强单元,对该初始事件序列进行第一数目的数据增强操作,得到对应的增强事件序列,其中,一次数据增强操作利用一个数据增强单元执行;策略信息至少指示所述第一数目;利用各增强事件序列形成的第一增强序列集合进行模型训练,得到隐私保护的第一业务模型。得到隐私保护的第一业务模型。得到隐私保护的第一业务模型。
【技术实现步骤摘要】
一种基于隐私保护的模型训练方法及装置
[0001]本说明书涉及隐私安全
,尤其涉及一种基于隐私保护的模型训练方法及装置。
技术介绍
[0002]针对成员推理的黑盒攻击指的是,在获得特定数据和目标业务模型API接口(即获得目标业务模型的黑盒访问权限)的情况下,来确定特定数据是否属于目标业务模型的训练数据集的攻击。训练数据集中的训练数据一般包括用户真实的数据,其中会包括用户隐私数据,若确定出特定数据属于训练数据,则获得了用户隐私数据,进而造成用户隐私泄露的问题。
[0003]例如目标业务模型为反欺诈场景中的反欺诈模型,其训练数据集的训练数据均包括用户的真实的转账消费信息,如果目标业务模型黑盒被攻击成功,则容易造成用户隐私如用户真实的转账消费信息的泄露。
技术实现思路
[0004]本说明书一个或多个实施例提供了一种基于隐私保护的模型训练方法及装置,以训练得到隐私保护的业务模型。
[0005]根据第一方面,提供一种基于隐私保护的模型训练方法,包括:
[0006]获得用于训练目标业务模型的初始事件序列集合;
[0007]针对所述初始事件序列集合中的各初始事件序列,根据第一增强策略的策略信息,基于预设的用于进行数据扰动修改的多个数据增强单元,对该初始事件序列进行第一数目的数据增强操作,得到对应的增强事件序列,其中,一次数据增强操作利用一个数据增强单元执行;所述策略信息至少指示所述第一数目;
[0008]利用各增强事件序列形成的第一增强序列集合进行模型训练,得到隐私保护的第一业务模型。
[0009]在一种可选实施方式中,所述数据增强单元,用于扰动修改以下中的一项或多项:事件序列中事件的顺序、数量、属性。
[0010]在一种可选实施方式中,还包括:
[0011]获得所述第一业务模型对应的第一效能结果;
[0012]根据所述第一效能结果和所述第一增强策略,确定用于下一轮次的第二增强策略。
[0013]在一种可选实施方式中,还包括:
[0014]获得所述第一业务模型对应的第一效能结果;
[0015]至少根据所述第一效能结果和所述第一业务模型,确定所述目标业务模型对应的目标隐私保护模型,或其备选模型。
[0016]在一种可选实施方式中,所述确定所述目标业务模型对应的目标隐私保护模型,
或其备选模型,包括:
[0017]获得所述初始事件序列集合对应的若干第二增强序列集合,其中,各第二增强序列集合,根据对应增强策略的策略信息,基于所述多个数据增强单元,对所述初始事件序列集合进行数据增强操作而得到;
[0018]分别利用各第二增强序列集合进行模型训练,得到对应的若干第二业务模型;
[0019]获得若干第二业务模型对应的若干第二效能结果;
[0020]基于所述第一效能结果和所述第二效能结果,从所述第一业务模型和若干第二业务模型中,确定出所述目标隐私保护模型,或所述备选模型。
[0021]在一种可选实施方式中,还包括:
[0022]获得所述目标业务模型对应的目标效能结果,所述目标业务模型利用所述初始事件序列集合训练得到;
[0023]所述从所述第一业务模型和若干第二业务模型中,确定出所述目标隐私保护模型,或所述备选模型,包括:
[0024]分别确定所述第一效能结果和若干第二效能结果,相对于所述目标效能结果的效能变化情况;
[0025]基于各效能变化情况,从所述第一业务模型和所述若干第二业务模型中,确定出效能变化情况表征效能较优的业务模型,作为所述目标隐私保护模型。
[0026]在一种可选实施方式中,所述第一效能结果包括如下结果的至少一个:业务预测准确性,被黑盒攻击成功的概率。
[0027]在一种可选实施方式中,所述策略信息还包括:扰动强度值,所述第一数目的数据增强操作包括第一增强操作,所述第一增强操作利用第一增强操作单元进行符合所述扰动强度值的数据扰动。
[0028]在一种可选实施方式中,所述数据扰动修改包括对事件序列中事件顺序和/或数量的扰动修改;所述多个数据增强单元包括用于执行以下操作中的至少一项的数据增强单元:
[0029]删除事件序列中的部分事件;
[0030]从事件序列中抽取出若干第一事件,对所述若干第一事件无放回抽样重排后放回事件序列;
[0031]从事件序列中抽取出若干第二事件,对所述若干第二事件有放回抽样重排后放回事件序列;
[0032]将事件序列中包含的第三事件修改为第四事件;
[0033]保持事件序列。
[0034]在一种可选实施方式中,所述数据扰动修改包括对事件序列中事件的属性的扰动修改;所述多个数据增强单元包括用于执行以下操作中的至少一项的数据增强单元:
[0035]针对事件序列中第五事件的数值型的第一属性,利用该第一属性的各属性值对应的高斯分布,对该第一属性的属性值进行扰动修改;
[0036]针对事件序列中第六事件的类别型的第二属性,利用该第二属性的各属性值对应的先验分布,对该第二属性的属性值进行扰动修改。
[0037]在一种可选实施方式中,所述策略信息还包括扰动强度值;所述利用该第一属性
的各属性值对应的高斯分布,对该第一属性的属性值进行扰动修改,包括:
[0038]基于该第一属性的各属性值对应的高斯分布,生成该第五事件的第一属性对应的扰动值;
[0039]基于所述扰动值以及所述扰动强度值,对该第一属性的属性值进行扰动修改。
[0040]在一种可选实施方式中,一次数据增强操作所利用的数据增强单元,是以等概率方式从所述多个数据增强单元中随机选择的。
[0041]根据第二方面,提供一种基于隐私保护的模型训练装置,包括:
[0042]第一获得模块,配置为获得用于训练目标业务模型的初始事件序列集合;
[0043]数据增强模块,配置为针对所述初始事件序列集合中的各初始事件序列,根据第一增强策略的策略信息,基于预设的用于进行数据扰动修改的多个数据增强单元,对该初始事件序列进行第一数目的数据增强操作,得到对应的增强事件序列,其中,一次数据增强操作利用一个数据增强单元执行;所述策略信息至少指示所述第一数目;
[0044]模型训练模块,配置为利用各增强事件序列形成的第一增强序列集合进行模型训练,得到隐私保护的第一业务模型。
[0045]在一种可选实施方式中,所述数据增强单元,用于扰动修改以下中的一项或多项:事件序列中事件的顺序、数量、属性。
[0046]在一种可选实施方式中,所述装置还包括:
[0047]第二获得模块,配置为获得所述第一业务模型对应的第一效能结果;
[0048]第一确定模块,配置为根据所述第一效能结果和所述第一增强策略,确定用于下一轮次的第二增强策略。
[0049]在一种可选实施方式中,所述装置还包括:
[0050]第三获得模块,配置为获得所述第一本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种基于隐私保护的模型训练方法,包括:获得用于训练目标业务模型的初始事件序列集合;针对所述初始事件序列集合中的各初始事件序列,根据第一增强策略的策略信息,基于预设的用于进行数据扰动修改的多个数据增强单元,对该初始事件序列进行第一数目的数据增强操作,得到对应的增强事件序列,其中,一次数据增强操作利用一个数据增强单元执行;所述策略信息至少指示所述第一数目;利用各增强事件序列形成的第一增强序列集合进行模型训练,得到隐私保护的第一业务模型。2.根据权利要求1所述的方法,其中,所述数据增强单元,用于扰动修改以下中的一项或多项:事件序列中事件的顺序、数量、属性。3.根据权利要求1所述的方法,还包括:获得所述第一业务模型对应的第一效能结果;根据所述第一效能结果和所述第一增强策略,确定用于下一轮次的第二增强策略。4.根据权利要求1所述的方法,还包括:获得所述第一业务模型对应的第一效能结果;至少根据所述第一效能结果和所述第一业务模型,确定所述目标业务模型对应的目标隐私保护模型,或其备选模型。5.根据权利要求4所述的方法,其中,所述确定所述目标业务模型对应的目标隐私保护模型,或其备选模型,包括:获得所述初始事件序列集合对应的若干第二增强序列集合,其中,各第二增强序列集合,根据对应增强策略的策略信息,基于所述多个数据增强单元,对所述初始事件序列集合进行数据增强操作而得到;分别利用各第二增强序列集合进行模型训练,得到对应的若干第二业务模型;获得若干第二业务模型对应的若干第二效能结果;基于所述第一效能结果和所述第二效能结果,从所述第一业务模型和若干第二业务模型中,确定出所述目标隐私保护模型,或所述备选模型。6.根据权利要求5所述的方法,还包括:获得所述目标业务模型对应的目标效能结果,所述目标业务模型利用所述初始事件序列集合训练得到;所述从所述第一业务模型和若干第二业务模型中,确定出所述目标隐私保护模型,或所述备选模型,包括:分别确定所述第一效能结果和若干第二效能结果,相对于所述目标效能结果的效能变化情况;基于各效能变化情况,从所述第一业务模型和所述若干第二业务模型中,确定出效能变化情况表征效能较优的业务模型,作为所述目标隐私保护模型。7.根据权利要求3所述的方法,其中,所述第一效能结果包括如下结果的至少一个:业务预测准确性,被黑盒攻击成功的概率。8.根据权利要求1
‑
7任一项所述的方法,其中,所述策略信息还包括:扰动强度值,所述第一数目的数据增强操作包括第一增强操作,所述...
【专利技术属性】
技术研发人员:王宁涛,周璟,吕乐,杨阳,范东云,傅幸,王维强,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。