【技术实现步骤摘要】
一种细粒度的机器学习遗忘方法、装置及电子设备
[0001]本申请涉及深度学习
,具体而言,涉及一种细粒度的机器学习遗忘方法
、
装置及电子设备
。
技术介绍
[0002]随着机器学习
、
深度学习
、
人工智能等相关技术的逐步发展,隐藏在这些技术背后的隐私安全问题也开始引起人们的关注,由于深度学习模型具有的黑盒属性,它只关注输入和输出之间的映射,因此模型可能记录一些关于训练集的信息,导致模型遭受攻击而导致敏感数据泄露或模型功能遭到破坏,成员隶属推理攻击和模型反转攻击是两种用来攻击模型,从模型中提取关于训练数据的信息;后门攻击会使模型在修改后的图像上学习到错误的信息,进而破坏模型的可用性
。
[0003]在机器学习领域,机器遗忘是实现数据的被遗忘权的方式,它不仅要求从训练集中删除特定的数据,也要求调整在这部分数据上进行训练的模型,以确保调整后的模型无法从这些数据中学习到有关的知识,因此,模型不仅需要通过遗忘数据来保证数据的隐私性和安全性,还需要忘记一 ...
【技术保护点】
【技术特征摘要】
1.
一种细粒度的机器学习遗忘方法,其特征在于,包括:根据已有分类任务的训练集,训练得到原始分类模型;根据已知需要删除的目标数据得到目标类别,所述目标类别为训练集中与所述目标数据具有相同分类标签的数据;根据目标类别训练得到细粒度聚类模型,并通过目标数据和所述细粒度聚类模型得到遗忘子集,所述遗忘子集为与所述目标数据在同一个聚类类别的数据子集;基于数据遗忘策略对所述遗忘子集进行遗忘
。2.
如权利要求1所述的细粒度的机器学习遗忘方法,其特征在于,所述根据目标类别训练得到细粒度聚类模型,并通过已知目标数据和所述细粒度聚类模型得到遗忘子集,所述遗忘子集为与所述目标数据在同一个聚类类别的数据子集,还包括:获取目标数据及目标类别,所述目标数据为已知遗忘数据,所述目标类别为训练集中与所述目标数据具有相同标签的数据;基于深度学习或机器学习对所述目标类别进行训练,得到细粒度聚类模型;将所述目标数据及所述目标类别输入所述细粒度聚类模型中,得到所有数据的聚类类别,并筛选出遗忘子集
。3.
如权利要求2所述的细粒度的机器学习遗忘方法,其特征在于,所述基于数据遗忘策略对所述遗忘子集进行遗忘,还包括:将所述遗忘子集中的所有数据进行多次拷贝,得到多个副本,除目标数据所在分类类别外,其余分类类别都拥有一个遗忘子集的数据副本,同时赋予每个所述副本一个新的标签,并通过多个所述副本替换所述遗忘子集,得到重构后的遗忘子集;基于所述重构后的遗忘子集和所述训练集除遗忘子集外的数据构成遗忘训练集,并通过所述遗忘训练集对所述原始分类模型进行微调
。4.
如权利要求2所述的细粒度的机器学习遗忘方法,其特征在于,基于深度学习或机器学习对所述目标类别进行训练,得到细粒度聚类模型,还包括:根据对比学习方法训练得到对比学习模型,所述对比学习模型作为特征提取器能够从数据样本上提取语义特征;基于邻居查找原则,将样本及其邻居样本作为同类别数据;利用所述样本及其邻居样本,训练得到细粒度聚类模型
。5.
如权利要求4所述的细粒度的机器学习遗忘方法,其特征在于,在所述利用所述样本及其邻居样本,训练得到...
【专利技术属性】
技术研发人员:姜涛,周航平,齐佩汉,陈陆瑶,李兴华,马建峰,
申请(专利权)人:西安电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。