基于密文的负数据库及深度学习的数据隐私保护方法技术

技术编号:33810567 阅读:20 留言:0更新日期:2022-06-16 10:20
本发明专利技术公开了一种基于密文的负数据库及深度学习的数据隐私保护方法,采用数据隐私保护模型进行数据隐私保护;首先对原始数据转换为二进制串,并于随机生成的密钥进行异或加密;接着选取负数据库生成算法,对机密数据生成相应的负数据库;并提取负数据库的梗概sketch;然后利用基于负数据库的激活函数估算公式来进行计算,从而完成神经网络的前向传播以及反向传播过程;直到神经网络收敛,获得训练好的数据隐私保护模型;本发明专利技术解决了例如差分隐私难以平衡隐私与利用率的问题以及同态加密等方法导致计算代价过大的问题,具有较强的鲁棒性,综合提升了隐私保护深度学习过程当中的效率以及精度。中的效率以及精度。中的效率以及精度。

【技术实现步骤摘要】
基于密文的负数据库及深度学习的数据隐私保护方法


[0001]本专利技术属于数据隐私保护
,涉及一种新的数据隐私保护方法,具体涉及一种基于密文的负数据库及深度学习的数据隐私保护方法。

技术介绍

[0002]在近些年里,深度学习因其能够从大规模数据中挖掘有用的知识而受到学术界和业界的广泛关注。深度学习已被应用于各个领域,并取得了许多令人瞩目的突破与发展。然而,很少有研究关注隐私问题的重要性,因为大量的数据被涉及,隐私问题变得比以往任何时候都重要。例如,医疗数据可能包含患者的私人数据,如疾病、家族史和DNA序列。而一些类似银行的金融机构他们存储着许多客户的敏感信息,一旦分析这些数据时遭到泄露将会造成不可估量的损失,甚至威胁到个人安全。因此,这些技术在造福人类加速社会发展的同时也更应该关注到它潜在的问题——隐私泄露问题。
[0003]近年来,已经有学者提出了几种保护隐私的深度学习方法,然而,它们中的大多数都遭受了效率下降或准确性的下降。具体来说,基于差分隐私的方法通过添加噪声来保护数据隐私,这会影响数据的准确性和实用性。基于同态加密的方法通常需要很高的计算成本,并且在具有大规模数据的场景中效率会变得难以承受。
[0004]负数据库(NDB)是一种新的信息表示形式,其灵感来自人工免疫系统中的负选择机制。NDB将信息存储在DB的补充集中以实现隐私保护,它还可以像传统数据库一样支持插入、删除、更新和选择等操作。已经证明逆向负数据库恢复原始数据是一个NP难问题。此外,它支持粗略的距离估计。这些特性使其适用于保护隐私的许多领域,例如。密码认证、信息隐藏、生物特征认证和数据挖掘等领域。
[0005]负数据结合深度学习虽然可以达到有效的隐私保护,但在参数设置较为极端的情况下隐私保护程度还有提升的可能。而异或运算作为一个简洁高效的操作被运用到各种场景中,如果在将数据转换为负数据库之前利用随机生成的二进制串进行异或处理将会更一步的保护数据的隐私。

技术实现思路

[0006]为了解决上述技术问题,本专利技术提供了一种基于密文的负数据结合深度学习算法的数据隐私保护方法及系。
[0007]本专利技术所采用的技术方案是:一种基于密文的负数据库及深度学习的数据隐私保护方法,采用数据隐私保护模型进行数据隐私保护;
[0008]所述数据隐私保护模型,获取过程包括以下步骤:
[0009]步骤1:对原始数据进行预处理,转换为二进制串X={X1…
X
n
};
[0010]步骤2:随机生成指定长度的密钥K与步骤1处理后的数据进行异或加密,获得加密后的数据X'={X1'

X
n
'};
[0011]步骤3:选取负数据库生成算法,针对步骤2加密后的数据X'={X1'

X
n
'},生成相
应的负数据库NDB={NDB1…
NDB
n
};
[0012]步骤4:从步骤3中提取负数据库的梗概S={S1...S
n
},其中S
i
是NDB
i
的梗概;
[0013]步骤5:基于梗概S,完成基于负数据库的激活函数估算,并训练深度学习网络,直到网络收敛,获得训练好的数据隐私保护模型。
[0014]本专利技术针对目前负数据库以及异或运算的特点,提出了一种基于密文的负数据库隐私保护方法,解决了例如差分隐私难以平衡隐私与利用率的问题以及同态加密等方法导致计算代价过大的问题,具有较强的鲁棒性,综合提升了隐私保护深度学习过程当中的效率以及精度。
附图说明
[0015]图1为本专利技术实施例的方法流程框图;
[0016]图2为本专利技术实施例的方法应用场景图;
[0017]图3为本专利技术实施例的异或加密示例图;
[0018]图4为本专利技术实施例与原始激活函数估算对比图。
具体实施方式
[0019]为了便于本领域普通技术人员理解和实施本专利技术,下面结合附图及实施例对本专利技术作进一步的详细描述,应当理解,此处所描述的实施示例仅用于说明和解释本专利技术,并不用于限定本专利技术。
[0020]请见图1和图2,本专利技术提供的一种基于密文的负数据库及深度学习的数据隐私保护方法,采用数据隐私保护模型进行数据隐私保护;
[0021]本实施例的数据隐私保护模型,获取过程包括以下步骤:
[0022]步骤1:对原始数据进行预处理,转换为二进制串X={X1…
X
n
};
[0023]步骤2:随机生成指定长度的密钥K与步骤1处理后的数据进行异或加密,获得加密后的数据X'={X1'

X
n
'};
[0024]本实施例中,利用随机生成的密钥K将原始数据X={X1…
X
n
}加密为X'={X1'

X
n
'};
[0025]密钥K为len
xor
的二进制串,若x=X
k
,则x的第i个属性的第j位将与密钥K的第(i
×
L+j)%len
xor
位进行异或运算其中,L表示属性的长度。附图3展示了异或加密案例。
[0026]本实施例可以根据原始数据的特点可以生成不同长度的密钥来达到不同程度的隐私保护。本实施例采用QK

hidden负数据库生成算法,它通过一组参数Q可以更细粒度的控制负数据库记录的分布,从而使得在进行计算的时候更加精确。
[0027]步骤3:选取负数据库生成算法,针对步骤2加密后的数据X'={X1'

X
n
'},生成相应的负数据库NDB={NDB1…
NDB
n
};
[0028]本实施例针对加密后的数据X'={X1'

X
n
'},再使用QK

hidden算法生成对应的负数据库NDB={NDB1…
NDB
n
},其中NDB
i
(i=1...n)是从密文X
i
'生成的负数据库。
[0029]步骤4:从步骤3中提取负数据库的梗概S={S1...S
n
},其中S
i
是NDB
i
的梗概,并将
其上传到高性能服务器上;
[0030]本实施例从NDB中的负数据库中提取梗概S={S1...S
n
},其中S
i
是NDB
i
的梗概,并将S以及标签数据y={y1…
y
n
}上传至服务器。
[0031]本实施例通过提取负数据库的sketch来提高效率。sketch作为一个二维数组,存储了每一位负数据库记录为
‘0’

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于密文的负数据库及深度学习的数据隐私保护方法,其特征在于:采用数据隐私保护模型进行数据隐私保护;所述数据隐私保护模型,获取过程包括以下步骤:步骤1:对原始数据进行预处理,转换为二进制串X={X1…
X
n
};步骤2:随机生成指定长度的密钥K与步骤1处理后的数据进行异或加密,获得加密后的数据X'={X1'

X
n
'};步骤3:选取负数据库生成算法,针对步骤2加密后的数据X'={X1'

X
n
'},生成相应的负数据库NDB={NDB1…
NDB
n
};步骤4:从步骤3中提取负数据库的梗概S={S1...S
n
},其中S
i
是NDB
i
的梗概;步骤5:基于梗概S,完成基于负数据库的激活函数估算,并训练深度学习网络,直到网络收敛,获得训练好的数据隐私保护模型。2.根据权利要求1所述的基于密文的负数据库及深度学习的数据隐私保护方法,其特征在于,步骤2中,利用随机生成的密钥K将原始数据X={X1…
X
n
}加密为X'={X1'

X
n
'};密钥K为len
xor
的二进制串,若x=X
k
,则x的第i个属性的第j位将与密钥K的第(i
×
L+j)%len
xor
位进行异或运算其中,L表示属性的长度。3.根据权利要求1所述的基于密文的负数据库及深度学习的数据隐私保护方法,其特征在于,步骤5中,对于Sigmoid、ReLU和tanh激活函数f1(z)、f2(z)、f3(z),在神经网络的计算方式如下:算方式如下:算方式如下:其中,z表示神经元中的线性计算结果,被表示为[x1…
x
M
]表示原始的隐私数据,x∈X,M表示输入x属性的个数,w1、

、w
M
表示神经网络中的权重参数;若输入为x,由其生成的负数据库为NDB
x
,则通...

【专利技术属性】
技术研发人员:赵冬冬张平川
申请(专利权)人:武汉理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1