【技术实现步骤摘要】
一种基于混合加密的高效联邦数据相关性计算方法
[0001]本专利技术涉及基于混合加密的高效联邦数据相关性计算方法领域
。
技术介绍
[0002]联邦机器学习是隐私计算在机器学习领域的应用,在不泄露各方隐私数据的情况下,能够融合多方的数据,通过机器学习算法,训练模型,进行预测
。
目前,联邦学习的安全模型多为半诚实模型
。
[0003]特征工程是一种在机器学习工程中的数据预处理方法,对样本的特征数据进行筛选,以及特征数据的离散化,以便之后能够训练出更好的机器学习模型
。
[0004]皮尔森
(Pearson)
系数是一种计算数据相关性的方法,可以用在特征工程中,计算样本数据特征之间的相关性,以便筛选出对整体模型预测作用不大,无关多余的特征
。
方便后期进行更好,更高效的机器学习模型训练
。
[0005]安全多方计算是一类密码学技术,也是当前密码学领域的一个热门研究方向,属于隐私计算范畴
。
主要用于两方或者多方希望在不泄露自己隐私输入数据的情况下,根据各方输入数据,共同计算一个函数结果
。
安全多方计算除了最终结果之外,每一方的输入都能保持隐私性
。
[0006]该研究方向起源于图灵机获得者姚期智提出的百万富翁问题,初期的解决方案效率较低,并不实用
。
近年来,随着该类技术的不断发展,效率大大提高,并开始逐步有实际落地应用
。
[0007 ...
【技术保护点】
【技术特征摘要】
1.
一种基于混合加密的高效联邦数据相关性计算方法,参与的双方为
A
方和
B
方,采用皮尔森计算方法,其特征在于:包括以下步骤:步骤
S1、
参与计算相关性系数的双方
A
,
B
,将各自的特征数据生成做点乘运算的张量
x
,
y
;步骤
S2、
参与方
A
本地生成
Paillier
加密的公钥
PK
,私钥
SK
;步骤
S3、
参与方
A
本地生成一个随机数
k
并加密
Enc
pk
(k)
,一个随机
nonce
值;
A
将
Enc
pk
(k)
和
nonce
发送给
B
;步骤
S4、
参与方
A
通过
k
和
nonce
生成密钥流
ks
,然后使用
ks
对
x
进行
mask
处理生成
Mask
k
,
nonce
(x)
;生成后,参与方
A
发送给参与方
B
;这里
Mask
k
,
nonce
(x)
为明文形式;步骤
S5、
参与方
B
通过参与方
A
发送过来的
nonce
以及
Mask
k
,
nonce
(x)
和
Enc
pk
(k)
,计算得到张量
x
加密后的密文
Enc
pk
(x)
;步骤
S6、
参与方
B
通过
Paillier
密文计算,计算
y
和
Enc
pk
(x)
的点积
EncDot(x
,
y)
=
Dot(Enc
pk
(x)
,
y...
【专利技术属性】
技术研发人员:谈扬,彭彦雄,
申请(专利权)人:深圳前海新心数字科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。