基于密文的负数据库及深度学习的数据隐私保护方法技术

技术编号：33810567 阅读：20 留言：0更新日期：2022-06-16 10:20

本发明专利技术公开了一种基于密文的负数据库及深度学习的数据隐私保护方法，采用数据隐私保护模型进行数据隐私保护；首先对原始数据转换为二进制串，并于随机生成的密钥进行异或加密；接着选取负数据库生成算法，对机密数据生成相应的负数据库；并提取负数据库的梗概sketch；然后利用基于负数据库的激活函数估算公式来进行计算，从而完成神经网络的前向传播以及反向传播过程；直到神经网络收敛，获得训练好的数据隐私保护模型；本发明专利技术解决了例如差分隐私难以平衡隐私与利用率的问题以及同态加密等方法导致计算代价过大的问题，具有较强的鲁棒性，综合提升了隐私保护深度学习过程当中的效率以及精度。中的效率以及精度。中的效率以及精度。

全部详细技术资料下载

【技术实现步骤摘要】
基于密文的负数据库及深度学习的数据隐私保护方法

[0001]本专利技术属于数据隐私保护
，涉及一种新的数据隐私保护方法，具体涉及一种基于密文的负数据库及深度学习的数据隐私保护方法。

技术介绍

[0002]在近些年里，深度学习因其能够从大规模数据中挖掘有用的知识而受到学术界和业界的广泛关注。深度学习已被应用于各个领域，并取得了许多令人瞩目的突破与发展。然而，很少有研究关注隐私问题的重要性，因为大量的数据被涉及，隐私问题变得比以往任何时候都重要。例如，医疗数据可能包含患者的私人数据，如疾病、家族史和DNA序列。而一些类似银行的金融机构他们存储着许多客户的敏感信息，一旦分析这些数据时遭到泄露将会造成不可估量的损失，甚至威胁到个人安全。因此，这些技术在造福人类加速社会发展的同时也更应该关注到它潜在的问题——隐私泄露问题。
[0003]近年来，已经有学者提出了几种保护隐私的深度学习方法，然而，它们中的大多数都遭受了效率下降或准确性的下降。具体来说，基于差分隐私的方法通过添加噪声来保护数据隐私，这会影响数据的准确性和实用性。基于同态加密的方法通常需要很高的计算成本，并且在具有大规模数据的场景中效率会变得难以承受。
[0004]负数据库(NDB)是一种新的信息表示形式，其灵感来自人工免疫系统中的负选择机制。NDB将信息存储在DB的补充集中以实现隐私保护，它还可以像传统数据库一样支持插入、删除、更新和选择等操作。已经证明逆向负数据库恢复原始数据是一个NP难问题。此外，它支持粗略的距离估计。这些特性使其适用于保护...

【技术保护点】

【技术特征摘要】
1.一种基于密文的负数据库及深度学习的数据隐私保护方法，其特征在于：采用数据隐私保护模型进行数据隐私保护；所述数据隐私保护模型，获取过程包括以下步骤：步骤1：对原始数据进行预处理，转换为二进制串X＝{X1…
X
n
}；步骤2：随机生成指定长度的密钥K与步骤1处理后的数据进行异或加密，获得加密后的数据X'＝{X1'
…
X
n
'}；步骤3：选取负数据库生成算法，针对步骤2加密后的数据X'＝{X1'
…
X
n
'}，生成相应的负数据库NDB＝{NDB1…
NDB
n
}；步骤4：从步骤3中提取负数据库的梗概S＝{S1...S
n
}，其中S
i
是NDB
i
的梗概；步骤5：基于梗概S，完成基于负数据库的激活函数估算，并训练深度学习网络，直到网络收敛，获得训练好的数据隐私保护模型。2.根据权利要求1所述的基于密文的负数据库及深度学习的数据隐私保护方法，其特征在于，步骤2中，利用随机生成的密钥K将原始数据X＝{X1…
X
n
}加密为X'＝{X1'
…
X
n
'}；密钥K为len
xor
的二进制串，若x＝X
k
，则x的第i个属性的第j位将与密钥K的第(i
×
L+j)％len
xor
位进行异或运算其中，L表示属性的长度。3.根据权利要求1所述的基于密文的负数据库及深度学习的数据隐私保护方法，其特征在于，步骤5中，对于Sigmoid、ReLU和tanh激活函数f1(z)、f2(z)、f3(z)，在神经网络的计算方式如下：算方式如下：算方式如下：其中，z表示神经元中的线性计算结果，被表示为[x1…
x
M
]表示原始的隐私数据，x∈X，M表示输入x属性的个数，w1、
…
、w
M
表示神经网络中的权重参数；若输入为x，由其生成的负数据库为NDB
x
，则通...

【专利技术属性】
技术研发人员：赵冬冬，张平川，
申请(专利权)人：武汉理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人