【技术实现步骤摘要】
自适应分配动态隐私预算的差分隐私保护深度学习算法
[0001]本专利技术属于信息安全
,具体涉及一种自适应分配动态隐私预算的差分隐私保护深度学习算法。
技术介绍
[0002]随着互联网技术的发展,日常生活中每天都会产生数以亿万计的数据,这些海量的数据中往往蕴含着潜在的、规律性的、最终可理解的知识或者模式。数据挖掘(Data Mining,DM)技术可以从这些海量的数据中发现并提取这些有用的信息,并反馈指导商业和人类生活,它主要采用机器学习方法和统计学知识原理进行知识挖掘,机器学习方法的研究和改进往往对数据挖掘的效率和结果有着重要的影响。深度学习(Deep Learning)是机器学习的分支,是一种试图使用包含复杂结构或由多重非线性变换构成的多个处理层对数据进行高层抽象的算法。深度学习在许多领域取得了令人印象深刻的突破,包括计算机视觉、语音识别、图像识别、自然语言处理以及搜索推荐等。其目标是建立一个多层网络,从原始输入数据中提取复杂特征,挖掘数据中隐藏的知识结构。
[0003]利用深度学习等数据挖掘算法可以发现隐藏于海量数据中的知识和模式,但这通常以牺牲隐私为代价。如果用于训练的隐私数据没有得到很好的保护,它们会通过模型参数或预测发生泄露,因此具有隐私保护性质的数据挖掘技术成为重要的需求。如何在运用深度神经网络算法的同时有效保护训练样本数据的隐私不受侵犯显得至关重要。Dalenius提出了隐私泄露控制的概念,k
‑
anonymity算法为基于等价类分组的匿名隐私保护算法奠定了基础,其次是 ...
【技术保护点】
【技术特征摘要】
1.自适应分配动态隐私预算的差分隐私保护深度学习算法,其特征在于,具体按照以下步骤实施:步骤1、给定数据集D={(X1,y1),(X2,y2),...,(X
j
,y
j
),...,(X
n
,y
n
)|j∈(1,n)},对于一条数据(X
j
,y
j
),X
j
表示数据特征,y
j
表示数据标签,即X
j
所属的类别,设定并初始化神经网络NN,神经网络NN包含输入层、隐藏层和输出层,使用数据集D训练神经网络NN,得到不具备隐私保护的深度学习模型M;步骤2、根据步骤1训练好的不具备隐私保护的深度学习模型M,使用LRP算法计算平均特征相关性步骤3、根据步骤2得出的平均特征相关性计算相关性比α
j
;步骤4、重新初始化神经网络NN,设定训练的迭代次数T,根据步骤3得到的相关性比α
j
,在训练过程中添加噪声,得到具有差分隐私保护的深度学习模型DPM,使得在使用该模型进行预测时能够保护数据隐私。2.根据权利要求1所述的自适应分配动态隐私预算的差分隐私保护深度学习算法,其特征在于,所述步骤1具体按照以下步骤实施:步骤1.1、给定包含图像的数据集D,设定神经网络NN,神经网络NN包含一个输入层、三个隐藏层和一个输出层,随机初始化神经网络参数ω;步骤1.2、从数据集D中随机选取一个批次的数据B,将数据B输入神经网络NN;步骤1.3、使用SGD算法训练神经网络NN,不断调整神经网络参数ω,得到最优神经网络参数ω
M
,于是得到不具有差分隐私保护的深度学习模型M,该模型用于后续步骤中对特征相关性R的计算。3.根据权利要求2所述的自适应分配动态隐私预算的差分隐私保护深度学习算法,其特征在于,所述步骤2具体按照以下步骤实施:步骤2.1、从数据集D中随机选取一条记录(X
i
,y
i
);步骤2.2、向步骤1训练好的模型M输入数据X
i
,得到模型预测值步骤2.3、根据模型预测值对最后一个隐藏层l中的每一个神经元p,计算神经元p和模型输出的特征相关性的特征相关性其中,z
pm
=a
p
ω
pm
是隐藏层l中的神经元p和其输出层神经元m之间的网络参数的乘积,a
p
表示神经元p的值,ω
pm
表示神经元p到神经元m的权重系数,即神经元p和神经元m之间的网络参数,z
m
=∑
p
z
pm
+b
m
是隐藏层l到输出层神经元m的仿射变换,b
m
表示最后一个隐藏层l到输出层神经元m的偏置值,是预定义的稳定器,用来避免出现分母为0的情况,且步骤2.4、计算最后一个隐藏层l中的每一个神经元p到其前一个隐藏层,即l
‑
1层中的
每个神经元q的相关性分解信息每个神经元q的相关性分解信息其中,z
qp
=a
q
ω
qp
表示神经元q和神经元p之间的神经网络参数ω
qm
的乘积,a
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。