基于区块链和联邦学习的医疗数据可信共享方法技术

技术编号:38902056 阅读:14 留言:0更新日期:2023-09-22 14:20
本发明专利技术公开了一种基于区块链和联邦学习的医疗数据可信共享方法,包括:数据共享层、区块链层和联邦学习层;分为5个步骤:用户注册、发出数据请求、数据请求处理、联邦学习、数据共享完成医疗数据的安全可信共享。本发明专利技术提出了一种基于身份可信认证和行为可信评估相结合的双因素可信模型,保证了共享区块链中用户的可信性。采用可信联邦平均聚合算法增加高可信高质量模型参数在聚合模型中的贡献度占比,从而提升医疗数据联邦学习聚合模型的准确率。而提升医疗数据联邦学习聚合模型的准确率。而提升医疗数据联邦学习聚合模型的准确率。

【技术实现步骤摘要】
基于区块链和联邦学习的医疗数据可信共享方法


[0001]本专利技术涉及种基于请求用户可信度的访问控制方法,特别是基于区块链和联邦学习的医疗数据可信共享方法。

技术介绍

[0002]随着医疗信息化水平的提高,海量医疗数据开放共享成为符合医疗卫生行业数据实际需求的必然趋势,具有重大应用价值。然而,如何兼顾数据共享和隐私保护,在保障数据安全的前提下发挥医疗数据价值,是当前学者们亟待解决的重要课题。
[0003]基于区块链的医疗数据共享模式存在数据存储空间受限、加解密的过程增加了互操作性的难度、共享效率差、计算开销大、数据隐私问题未解决等问题。而区块链与联邦学习技术进行融合可以极大整合两方优势,相互补充。结合区块链和联邦学习的安全可信数据共享,与传统的基于区块链的数据共享方式不同,不需要传输原始数据,而是通过联邦学习模型将原始数据抽取为数据模型,通过共享数据模型实现“数据可用不可见”。联邦学习模型参数存储在区块链中,保证了模型参数的安全性与可靠性。
[0004]但是现有基于区块链和联邦学习的数据共享模式在医疗共享网络中应用面临着以下两方面的重要问题:(1)多参与方信任问题。参与联邦训练的客户端可靠性被忽略,可能存在半诚实或恶意的客户端节点。(2)联邦平均聚合算法不合理。区块链节点收集到参与训练节点的本地模型之后进行模型聚合,现有的模型聚合方法主要是联邦平均,但联邦平均没有考虑到低可信度低质量的模型参与聚合带来的全局模型质量降低问题,影响整个联邦学习任务模型的质量,进而影响医疗数据共享的效果。
专利技术内容
[0005]针对现有技术中存在的缺陷,本专利技术的目的在于提供一种基于区块链和联邦学习的医疗数据可信共享方法。
[0006]为了实现上述目的,本专利技术所述的基于区块链和联邦学习的医疗数据可信共享方法,由以下部分组成:数据共享层、区块链层和联邦学习层;
[0007]数据共享层:医疗机构通过用户注册和身份可信计算加入医疗数据共享联盟链;数据请求者进行数据请求信息的发布;通过区块链共享平台获得联邦学习全局模型;
[0008]区块链层:针对特定的数据共享请求,行为可信计算根据链上数据检索机制和联邦客户端的选择机制,进行数据提供方的节点选择,组建联邦训练委员会,并根据可信联邦平均聚合算法更新全局模型;
[0009]联邦学习层:模型训练委员会成员基于其本地数据集执行联邦学习,来训练同一个联邦学习模型;当数据提供者参与到联邦学习过程中,其信任值更新并存储在区块链上;
[0010]工作步骤如下:
[0011]Step 1、用户注册:用户上传自己的用户注册信息reg,可信认证中心CA为加入区块链的节点进行身份可信计算,身份可信计算智能合约ITSC为参与数据共享的用户设置了
一定的准入门槛,审核通过的用户系统分配其唯一标识ID和公钥Pk,颁发身份可信证书,完成用户身份的注册;
[0012]Step 2、发出数据请求:数据请求者DR在区块链上发布数据共享请求req,req中包含请求的数据描述信息,表明所需要的数据类型、数据大小、数据质量、时间。该请求作为数据记录存放在联盟链上,区块链保存其交易的哈希时间戳,维护链上交易的可审计;
[0013]Step 3、数据请求处理:区块链系统收到数据请求req后,根据链上的检索机制和信任机制,计算各数据提供方的行为信任值,执行行为可信智能合约BTSC选择高可信的联邦学习客户端SP
i
,组成一个联邦学习训练委员会SP={SP1,SP2,

,SP
n
};
[0014]Step4、联邦学习:联邦学习训练委员会的成员根据数据请求req,基于自己的本地数据集执行联邦学习算法,分布式地协作训练同一个联邦学习模型,直到模型拟合或达到迭代次数;在每次模型更新过程中,使用差分隐私实现全局参数的加密聚合,并通过基于节点贡献度的共识机制选取记账节点。区块链记录模型参数的更新过程,实现参数的可审计性;
[0015]Step 5、数据共享:联邦学习任务完成后,全局模型M加密保存在区块链中。相关的数据请求者收到联邦学习任务完成的广播后,从联盟链上下载加密的模型文件,并对其进行解密,获取共享的模型M。因此,数据请求者在不获取患者原始数据的情况下,通过共享平台实现了医疗数据的获取,达到了医疗数据的安全可信共享的目的。
[0016]优选的,所述Step 1中身份可信计算过程为:
[0017]判断用户属性是否存在,若不存在用户身份可信度为0,不允许进行链上注册;如果存在,则构建由用户的属性原始数值构成的正向化矩阵为X=(x
ij
)
m
×
n
;其中m是待评价用户数量,n是身份可信属性评价指标数量;x
ij
是第i个待评价用户的第j项身份可信属性评价指标归一化处理得到标准化后的矩阵p
ij
;计算第j项属性的信息熵值e
j
;计算信息效用值d
j
;计算各个属性指标所占据的权重W
j
;算出用户的身份可信度IT
i
;如果IT
i
≥IT
threshold
;IT
threshold
是信任阈值,对其进行身份标识制作身份凭证,返回用户标识ID和公钥Pk,用户注册成功;
[0018]所述用户属性包括机构名称name、所属联盟allianceID、信息化程度a1、组织管理能力a2、抗攻击能力a3、本地数据量a4、计算能力a5、网络可靠性a6。
[0019]优选的,所述Step3中行为信任计算过程为:根据评估用户与被评估用户所在联盟区域的异同对联盟内信任度和联盟间信任度分别进行研究,两者在同一联盟内,联盟内用户直接综合信任度根据直接信任度和推荐信任度综合得到;
[0020]两者在不同联盟,在联盟内信任度评估的基础上,联盟间以联盟为单位,根据域间交互行为影响域间信任度,最终得到联盟间不同用户之间的综合信任度。
[0021]优选的,所述联盟内信任计算过程为:用户i对用户j的行为可信综合信任值BT
ij
可以表示为:
[0022]BT
ij
=α
·
DT
ij

·
RT
ij

[0023]其中,DT
ij
为直接信任值,RT
ij
为推荐信任值,α,β为直接信任度和推荐信任度在综合信任值计算中所占的权重,α,β∈(0,1)且α+β=1。
[0024]优选的,所述直接信任度计算过程为:假设n次历史医疗共享任务中,医院I对医院J的信任度结合交互时间形成的序列为S=(<t1,DT1(i,j)>,<t2,DT2(i,j)>,

,<t
n
,
DT
n
(i,j)>)。t<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于区块链和联邦学习的医疗数据可信共享方法,其特征在于由以下部分组成:数据共享层、区块链层和联邦学习层;数据共享层:医疗机构通过用户注册和身份可信计算加入医疗数据共享联盟链;数据请求者进行数据请求信息的发布;通过区块链共享平台获得联邦学习全局模型;区块链层:针对特定的数据共享请求,行为可信计算根据链上数据检索机制和联邦客户端的选择机制,进行数据提供方的节点选择,组建联邦训练委员会,并根据可信联邦平均聚合算法更新全局模型;联邦学习层:模型训练委员会成员基于其本地数据集执行联邦学习,来训练同一个联邦学习模型;当数据提供者参与到联邦学习过程中,其信任值更新并存储在区块链上;工作步骤如下:Step 1、用户注册:用户上传自己的用户注册信息reg,可信认证中心CA为加入区块链的节点进行身份可信计算,身份可信计算智能合约ITSC为参与数据共享的用户设置了一定的准入门槛,审核通过的用户系统分配其唯一标识ID和公钥Pk,颁发身份可信证书,完成用户身份的注册;Step 2、发出数据请求:数据请求者DR在区块链上发布数据共享请求req,req中包含请求的数据描述信息,表明所需要的数据类型、数据大小、数据质量、时间。该请求作为数据记录存放在联盟链上,区块链保存其交易的哈希时间戳,维护链上交易的可审计;Step 3、数据请求处理:区块链系统收到数据请求req后,根据链上的检索机制和信任机制,计算各数据提供方的行为信任值,执行行为可信智能合约BTSC选择高可信的联邦学习客户端SP
i
,组成一个联邦学习训练委员会SP={SP1,SP2,

,SP
n
};Step 4、联邦学习:联邦学习训练委员会的成员根据数据请求req,基于自己的本地数据集执行联邦学习算法,分布式地协作训练同一个联邦学习模型,直到模型拟合或达到迭代次数;在每次模型更新过程中,使用差分隐私实现全局参数的加密聚合,并通过基于节点贡献度的共识机制选取记账节点。区块链记录模型参数的更新过程,实现参数的可审计性;Step 5、数据共享:联邦学习任务完成后,全局模型M加密保存在区块链中。相关的数据请求者收到联邦学习任务完成的广播后,从联盟链上下载加密的模型文件,并对其进行解密,获取共享的模型M。因此,数据请求者在不获取患者原始数据的情况下,通过共享平台实现了医疗数据的获取,达到了医疗数据的安全可信共享的目的。2.根据权利要求1所述的基于区块链和联邦学习的医疗数据可信共享方法,其特征在于:所述Step 1中身份可信计算过程为:判断用户属性是否存在,若不存在用户身份可信度为0,不允许进行链上注册;如果存在,则构建由用户的属性原始数值构成的正向化矩阵为X=(x
ij
)
m
×
n
;其中m是待评价用户数量,n是身份可信属性评价指标数量;x
ij
是第i个待评价用户的第j项身份可信属性评价指标归一化处理得到标准化后的矩阵p
ij
;计算第j项属性的信息熵值e
j
;计算信息效用值d
j
;计算各个属性指标所占据的权重W
j
;算出用户的身份可信度IT
i
;如果IT
i
≥IT
threshold
;IT
threshold
是信任阈值,对其进行身份标识制作身份凭证,返回用户标识ID和公钥Pk,用户注册成功;所述用户属性包括机构名称name、所属联盟allianceID、信息化程度a1、组织管理能力a2、抗攻击能力a3、本地数据量a4、计算能力a5、网络可靠性a6。
3.根据权利要求1所述的基于区...

【专利技术属性】
技术研发人员:姜茸张荷娇
申请(专利权)人:云南财经大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1