【技术实现步骤摘要】
一种适用于医疗行业隐私数据保护的基于区块链的联邦学习方法
[0001]本专利技术涉及医疗隐私数据处理领域,特别涉及一种适用于医疗行业隐私数据保护的基于区块链的联邦学习方法
。
技术介绍
[0002]近些年来,深度学习方法在
NLP、CV、OCR
等领域大放异彩,深入应用到了社会各个行业的方方面面,当前在临床科研
、
医疗诊断行业也展现了巨大的潜力
。
深度学习方法可以通过大量的医疗影像数据学习某种疾病的特征,进行智能识别,从而辅助医生诊断病人可能患上的疾病,提高诊疗效率
。
但也存在某些方面的问题,首先,训练一个准确优秀的深度学习模型所需的数据量相当庞大,通常单个医疗机构很难满足要求,还由于国家法律法规的限制,以及患者对自身隐私的要求,医疗机构之间无法共享彼此的数据,这就存在了数据孤岛的问题
。
[0003]联邦学习是一种新兴的分布式深度学习方法,可用于解决上述的数据孤岛问题
。
联邦学习在本地设备上训练模型并传输模型参数 ...
【技术保护点】
【技术特征摘要】
1.
一种适用于医疗行业隐私数据保护的基于区块链的联邦学习方法,其特征在于,包括以下步骤:步骤1:可信第三方服务器参数初始化:服务器用一个干净的根数据集训练出模型然后上传到区块链,同时计算每个参与方
P
i
的份额
E(s
i
,t
i
)
和加密时用到的密钥对
(pk,sk
i
)
;步骤2:区块链随机初始化一个全局模型各参与方从区块链下载模型然后在本地数据集
D
i
上训练得到本地梯度步骤3:参与方对份额
E(s
i
,t
i
)
进行第一次验证,对于份额验证成功和失败的参与方划分成两个集合,将验证成功的参与方添加到集合
TP
中,并用阈值全同态加密算法对
TP
中各参与方的梯度进行加密,将验证失败的参与方添加到集合
FP
中,区块链拒绝集合
FP
计算的梯度上链;步骤4:将
FHE
表示为一个通用的全同态加密算法,阈值全同态加密算法
TFHE
基于
FHE
方案给出,对进行加密,执行得到加密梯度,然后参与方向区块链上传加密梯度步骤5:计算模型与之间的余弦相似度,将计算结果输入到
ReLU
函数中以此剔除恶意梯度;步骤6:区块链将审计通过的参与方更新为一个新的集合
FTP
,然后使用公式对集合中的加密梯度进行聚合,由于此时是密文状态,仍使用算法实现聚合,聚合结果
C
j
将重新发送给
FTP
中的参与方;步骤7:
FTP
中的参与方对聚合后的梯度部分解密,即得到一个部分明文,然后将结果上传到区块链;步骤8:区块链执行解密算法,并进行模型更新
w
j+1
=w
j
‑
η
w
j
,将模型再次发送给各参与方;步骤9:重复步骤3‑
步骤8,当全局模型收敛到一定条件时,运行结束
。2.
根据权利要求1所述的适用于医疗行业隐私数据保护的基于区块链的联邦学习方法,其特征在于,所述步骤1中计算每个参与方
P
i
的份额
E(s
i
,t
i
)
和加密时用到的密钥对
(pk,sk
i
)
的具体过程如下:首先选择两个大素数
p
,
q
,且
q|(p
‑
1)
,阶为大素数
q
的循环群
G
q
是的唯一子群,设
g、h
是群
G
q
中的两个生成元,且任何人都不知道离散对数公开元组
(q,g,h)
,存在另一个阶为素数
q
的整数群
Z
q
,并选取秘密份额
s∈Z
q
以及随机数
t∈Z
q
,阈值取为
k
;份额分发:服务器利用之前选取的
s
,
t
生成
Pedersen
承诺
E0=
E(s
,
t)
=
g
s
h
t
,生成以下两个
k
‑1阶多项式:
F(x)
=
s+f1x+f2x2+
…
+f
k
‑1x
k
‑1G(x)
=
t+g1x+g2x2+
…
+g
k
‑1x
k
‑1其中,
f,g
是多项式的系数,
x
是生成这个多项式的非零元素,对每个参与方
p
i
都会计算
一个
s
i
=
F(x
i
)
,
t
i
=
G(x
i
)
,
i
=
1,2,...,n
,然后将
E(s
i
,t
i
)
发送给各个参与方;使用树萨莫尔秘密共享算法
L
‑
TreeShamirSecretShare
,以下简称
L
‑
TreeSSS
算法,将秘钥分割成碎片分发给不同的参与方以实现门限解密的功能,表示为
L
‑
TreeSSS
=
(TreeSSS.Share,TreeSSS.Combine)
;
TreeSSS.Share
:令
L
表示为树的深度,
sk∈Z
...
【专利技术属性】
技术研发人员:金春花,罗晨风,李路路,李佼佼,刘畅,陈冠华,邵鹤帅,
申请(专利权)人:淮阴工学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。