【技术实现步骤摘要】
一种成员推断模型的训练方法
本说明书涉及信息
,特别涉及一种成员推断模型的训练方法。
技术介绍
成员推断(或称为成员推理、成员探测)是指数据持有者通过API获得模型的响应数据并在此基础上推测输入数据(或称为特征数据)是否属于模型的训练集。成员推断具有一定的威胁。现实中,模型的训练集可能来源于涉及实体隐私的敏感数据库,一旦数据持有者推断出某个ID属于含有敏感信息的训练集,很有可能造成实体隐私的泄露。因此,有必要在模型设计之初来测试其抵御成员推断的能力,以提高模型的安全性,避免潜在的隐私泄露风险。
技术实现思路
本说明书实施例之一提供一种成员推断模型的训练方法。所述方法包括:获取探测样本的特征值,将探测样本的特征值送入目标模型,以获得所述目标模型针对探测样本的响应数据;获取响应数据的置信度,并基于响应数据的置信度与设定阈值的比较结果确定探测样本的类别,所述类别指示该探测样本是否为目标模型训练集的成员;将探测样本的特征值以及所述目标模型针对该探测样本的响应数据作为输入,将探测样本的类别作为标签,训
【技术保护点】
1.一种成员推断模型的训练方法,其中,包括:/n获取探测样本的特征值,并将所述探测样本的特征值送入目标模型,以获得所述目标模型针对探测样本的响应数据;/n获取响应数据的置信度,并基于响应数据的置信度与设定阈值的比较结果确定探测样本的类别,所述类别指示该探测样本是否为目标模型训练集的成员;/n将探测样本的特征值以及所述目标模型针对该探测样本的响应数据作为输入,将探测样本的类别作为标签,训练成员推断模型。/n
【技术特征摘要】
1.一种成员推断模型的训练方法,其中,包括:
获取探测样本的特征值,并将所述探测样本的特征值送入目标模型,以获得所述目标模型针对探测样本的响应数据;
获取响应数据的置信度,并基于响应数据的置信度与设定阈值的比较结果确定探测样本的类别,所述类别指示该探测样本是否为目标模型训练集的成员;
将探测样本的特征值以及所述目标模型针对该探测样本的响应数据作为输入,将探测样本的类别作为标签,训练成员推断模型。
2.如权利要求1所述的方法,其中,所述探测样本的类别包括正样本和负样本;其中,正样本指示所述探测样本为目标模型训练集的成员,负样本指示所述探测样本不是目标模型训练集的成员;
所述基于响应数据的置信度与设定阈值的比较结果确定探测样本的类别,包括:
当所述置信度大于所述设定阈值时,将对应的探测样本的类别确定为正样本,否则,将对应的探测样本的类别确定为负样本。
3.如权利要求1所述的方法,其中,所述获取探测样本的特征值,包括:
随机生成第一输入;
将第一输入送入生成器,以获得探测样本的特征值。
4.如权利要求3所述的方法,其中,还包括:
调整生成器的参数和/或结构,以调整所述生成器的正样本生成率;所述正样本生成率为所述生成器生成的构造样本中,被确定为所述目标模型训练集的成员的构造样本...
【专利技术属性】
技术研发人员:张斌,陈岑,
申请(专利权)人:支付宝杭州信息技术有限公司,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。