The invention relates to a data memory elimination method and device for a deep learning model. The steps of the method include: saving the intermediate model obtained in the initial training process of the deep learning model; When retraining the deep learning model after deleting the data, directly call the intermediate model closest to the deleted data point before deleting the data point as the initialized forgetting model; The initial forgetting model is retrained with the data after deleting the data points, and the residual memory of the deleted data on the retraining model is measured. When the residual memory is reduced to be negligible, the retraining is terminated without timing; After the heavy training is finished, the saved middle model is used to stitch the forgotten model after training, and the final forgetting model is obtained. The invention greatly reduces the time and computing power required by the model service provider to provide the deletion service, provides privacy protection for the deleted data, and ensures the high availability of the model after forgetting the data.
【技术实现步骤摘要】
一种针对深度学习模型的数据记忆消除方法和装置
本专利技术主要涉及为实现深度神经网络的训练数据隐私保护,提出一种针对深度学习模型遗忘的数据记忆消除方法和装置。
技术介绍
以神经网络为代表的深度学习技术带来了人工智能发展的第三次浪潮,显著提升了图像分类,语音识别,自然语言处理的能力,为人们的生产生活方式带来了巨大的便利。训练一个高准确率和高可靠性的模型,往往需要依赖大量的训练数据。这些从大量用户采集而来的数据往往包含用户的隐私或敏感信息。例如,房屋门牌号的图像数据可能会暴露房主的家庭住址、建筑材料和房屋颜色,商场的购物记录数据可能会暴露用户的购物喜好、购物习惯和收入水平。因此,针对模型带来的隐私泄露风险用户可能要求模型服务商将自己的数据从模型中移除。另外,从立法的角度来看,许多国家的法律法规都强调用户有权删除用户的私有数据。因此,除了从训练集中删除用户的隐私数据,模型服务商还必须在已训练完成的模型中移除该数据所带来的影响。为了删除数据在模型中的影响,最直接的方法是将训练集中的数据删除并在此数据基础上重新训练一个深度学习模型。但是,由于深度学习模型的规模越来越大,每次训练会耗费大量的时间和算力,重训练的方法已不太可行。
技术实现思路
针对上述问题,本专利技术提出了一种针对深度学习模型遗忘的数据记忆消除技术,帮助模型服务商大幅缩减了模型遗忘服务所需要的时间及算力开销,帮助数据拥有者高效删除其数据信息,提供了数据隐私保护,并获得具有高可用性的模型。本专利技术首先提出时序残留记忆(Tempor ...
【技术保护点】
1.一种针对深度学习模型的数据记忆消除方法,其特征在于,包括以下步骤:/n保存在深度学习模型的初次训练过程中得到的中间模型;/n在删除数据后对深度学习模型进行重训练时,直接调用在删除数据点之前且与删除数据点最接近的中间模型作为初始化的遗忘模型;/n利用删除数据点之后的数据对初始化的遗忘模型进行重训练,并衡量删除数据在重训练模型上的残留记忆,当残留记忆降低到能够忽略不计时终止重训练;/n在重训练结束后,调用保存的中间模型对重训练后的遗忘模型进行拼接,得到最终的遗忘模型。/n
【技术特征摘要】
1.一种针对深度学习模型的数据记忆消除方法,其特征在于,包括以下步骤:
保存在深度学习模型的初次训练过程中得到的中间模型;
在删除数据后对深度学习模型进行重训练时,直接调用在删除数据点之前且与删除数据点最接近的中间模型作为初始化的遗忘模型;
利用删除数据点之后的数据对初始化的遗忘模型进行重训练,并衡量删除数据在重训练模型上的残留记忆,当残留记忆降低到能够忽略不计时终止重训练;
在重训练结束后,调用保存的中间模型对重训练后的遗忘模型进行拼接,得到最终的遗忘模型。
2.根据权利要求1所述的方法,其特征在于,所述保存在深度学习模型的初次训练过程中得到的中间模型,包括:
将数据集按训练顺序划分成n个数据片,并且在训练原始模型时,当训练完成每个数据片后都对此时的模型进行存储,即训练完前i个数据片后得到模型M(i),并将模型的参数提取成向量P(i),当训练完n个数据片后得到M(n)。
3.根据权利要求2所述的方法,其特征在于,所述直接调用在删除数据点之前且与删除数据点最接近的中间模型作为初始化的遗忘模型,包括:
假定需要删除的数据点位于第k个数据片,令原第k个数据片表示为D(k),删除数据点后第k个数据片表示为Du(k),其它数据片没有发生变化,取前k-1个数据片训练后保存的模型M(k-1),令遗忘模型Mu初始化为M(k-1),将模型的参数提取成向量Pu(k-1)。
4.根据权利要求3所述的方法,其特征在于,所述衡量删除数据在重训练模型上的残留记忆,包括:
取遗忘模型在训练数据片D(k+t)前后的模型参数变化量,即Vu(k+t)=Pu(k+t)-Pu(k+t-1);
取原始模型在训练数据片D(k+t)前后的模型参数变化量,即令V(k+t)=P(k+t)-P(k+t-1);
计算两个变化量的差向量的L1范数,即令Δ(k+t)=||Vu(k+t)-V(k+t)||1;通过Δ(k+t)衡量删除数据在重训练模型上的残留记忆。
5.根据权利要求4所述的方法,其特征在于,利用去趋势波动分析技术和最小二乘法来分析所述残留记忆是否下降到平稳水平。
6.根据权利要求5所述的方法,其特征在于,所述的利用去趋势波动分析技术和最...
【专利技术属性】
技术研发人员:孟国柱,何英哲,陈恺,何锦雯,胡兴波,
申请(专利权)人:中国科学院信息工程研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。