一种基于梯度上升的隐私保护方法及系统技术方案

技术编号:41451498 阅读:31 留言:0更新日期:2024-05-28 20:40
本发明专利技术提出了一种基于梯度上升的隐私保护方法及系统,采用梯度上升策略针对特定的遗忘数据进行模型参数的更新,使模型在这些数据上的性能下降,从而实现数据的遗忘;在执行梯度上升遗忘后,利用不在遗忘列表中的数据进行模型的微调,确保模型在非遗忘数据上的性能不受太大影响。

【技术实现步骤摘要】

本专利技术属于数据隐私保护领域,尤其涉及一种基于梯度上升的隐私保护方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。

2、随着数字化时代的快速发展,数据量呈现爆炸性增长,而数据中往往蕴含有大量的个人隐私信息。如何在确保数据的有效利用的同时,维护用户隐私,已经成为科研界和产业界共同关心的问题。近年来,隐私保护技术得到了广泛的研究,其中,差分隐私、同态加密等技术应用逐渐成熟。但在实际应用中,如何确保一个模型在学习新数据后可以遗忘旧数据,即机器遗忘学习,仍然是一个尚未得到完美解决的难题。

3、在多数现有的机器学习模型中,一旦模型训练完成,即使删除了原始数据,模型仍然能够间接地保存或回溯到某些信息,可能导致隐私泄露。这使得单纯从数据存储角度出发的隐私保护方法显得不够全面。此外,为了满足新的业务需求或法律法规的要求,有时候还需要模型能够遗忘某些特定的数据。

4、现有的技术主要集中在两个方向。一是如何组建数字孪生网络进行数据分享,另一个是如何利用同步联邦学习进行模型分享。

本文档来自技高网...

【技术保护点】

1.一种基于梯度上升的隐私保护方法,其特征在于,包括:

2.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,还包括:对获取的训练样本进行分组,对于分组后的训练样本的数据计算哈希值,作为标志符。

3.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,所述损失函数采用交叉熵损失函数。

4.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,在对指定遗忘数据的深度学习模型进行微调后,还包括:采用相同数量的指定遗忘训练样本和非遗忘训练样本构成数据集;基于所构成的数据集对深度学习模型进行测试;采用准确率、召回率和F1得分评价深...

【技术特征摘要】

1.一种基于梯度上升的隐私保护方法,其特征在于,包括:

2.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,还包括:对获取的训练样本进行分组,对于分组后的训练样本的数据计算哈希值,作为标志符。

3.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,所述损失函数采用交叉熵损失函数。

4.如权利要求1所述的一种基于梯度上升的隐私保护方法,其特征在于,在对指定遗忘数据的深度学习模型进行微调后,还包括:采用相同数量的指定遗忘训练样本和非遗忘训练样本构成数据集;基于所构成的数据集对深度学习模型进行测试;采用准确率、召回率和f1得分评价深度学习模型的性能。

5.如权利要求4所述的一种基于梯度上升的隐私保护方法,其特征在于,在对指定遗忘数据的深度学习模型进行微调时,执行梯度下降进行训练迭代。

6.如权利要求2所述的一种基于梯度上...

【专利技术属性】
技术研发人员:高龙翔王宝海曲悠扬顾树俊崔磊李秉泽
申请(专利权)人:山东省计算中心国家超级计算济南中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1