System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于联邦区块链的医疗数据分析用可扩展个性化异构方法技术_技高网

基于联邦区块链的医疗数据分析用可扩展个性化异构方法技术

技术编号:40060381 阅读:8 留言:0更新日期:2024-01-16 22:35
本发明专利技术公开了一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,设计基于不同任务类型的可拓展的联邦区块链模型,采用加入差分隐私的FedProx算法建立训练模型,加入近端项以限制本地模型相对于全局模型的偏离程度,又允许结点进行"不精确"本地训练,以解决系统异构及统计异构问题;并且,将联邦学习算法与差分隐私结合,在本地数据集及上传模型参数时加入高斯白噪声,在区块链中,采用委员会共识机制,以达到对投毒攻击、模型梯度倒推、恶意结点攻击、中心服务器攻击的防御,利用模型相似度个性化训练,选取与本地模型梯度相似度高的其他结点进行动态聚簇,在簇内进行模型聚合,实现本地模型的个性化,同时有利于模型收敛。

【技术实现步骤摘要】

本专利技术涉及医疗数据分析领域,尤其一种联邦区块链的医疗数据分析用可扩展个性化异构方法。


技术介绍

1、医疗健康数据(例如电子病历)中包含大量医疗信息,对其进行分析挖掘可应用于疾病预测、辅助医疗诊断、个性化信息推荐、临床决策支持、用药模式挖掘等。然而,采用传统的云计算方式存储和处理健康数据,一方面可能造成云端网络通信开销和负载压力,另一方面由于云计算使用多个医疗健康机构个人数据,可能造成部门间利益冲突和患者个人数据泄漏。正是因为医疗数据的敏感性和隐私性,许多用户数据不能公开,这导致了“数据孤岛”的现象。因此,如何在保证用户个人隐私和数据安全的情况下,充分发挥机器学习等人工智能方法的潜力是一项意义深远而又亟待解决的问题。

2、近年来,为了解决分布式数据机构产生的数据孤岛以及集中式数据收集模式带来的隐私泄露的问题,联邦学习将机器学习模型分布式地部署在边缘结点上。在联邦学习中,边缘结点从中心服务器处下载初始全局模型,将收集到的用户原始数据在本地进行模型训练,只需将训练出的本地模型梯度上传至中心聚合服务器,与其他结点的模型梯度进行聚合得到全局模型,经过多次迭代,全局模型收敛,得到最终全局模型,这一过程并没有泄露原始数据给第三方,很好地保护了隐私并提高了训练效率。然而,传统联邦学习自身也面临安全攻击和隐私攻击:

3、1.zhang等人提出了一种基于生成对抗网络的数据投毒攻击算法。该算法通过修改恶意方本地训练的超参数,在恶意方的模型更新上添加比例系数,从而提高恶意更新对全局模型的影响力,扩大生成数据的毒害效果(zhang,j.,chen,b.,cheng,x.,binh,h.t.t.,&yu,s.(2020).poisongan:generative poisoning attacks against federatedlearning in edge computing systems.ieee internet of things journal,8(5),3310-3322.)

4、2.fredrikson等人提出了一种基于预测值置信度的模型反演算法。该算法模型倒推攻击可以从模型中反推训练数据的属性值。(fredrikson,m.,jha,s.,&ristenpart,t.(2015,october).model inversion attacks that exploit confidence informationand basic countermeasures.in proceedings of the 22nd acm sigsac conference oncomputer and communications security(pp.1322-1333).)

5、传统联邦学习由终端设备、边缘结点和中心服务器三层架构组成,中心服务器负责全局模型的初始化、聚合和更新,若中央聚合服务器攻破,所有边缘结点的模型梯度均会泄露,经过梯度倒推,所有结点的原始数据均会被攻击方获取,将会对边缘结点带来严重威胁。此外,不同边缘结点的底层数据集分布具有各自的异构性,而中心服务器只能根据各节点模型梯度聚合出唯一的共同全局模型,不会使模型适用于每一个用户,无法适用于医疗物联网场景下的特异性诊断。并且,传统的联邦平均算法不允许参与训练的结点执行可变的工作量,只是简单地丢弃在指定时间内无法完成计算任务的结点。基于这样的局部更新方案,每轮迭代只有很少的有效结点参与聚合,对模型收敛存在不利影响。


技术实现思路

1、本专利技术的目的是为了克服上述提到的目前研究缺点,提出了医疗物联网场景下的一种基于联邦区块链的可扩展个性化异构算法(ablockchain-based scalablepersonalized heterogeneous federated learning algorithmin the scenario ofmedical internet of things,bsphfl),在该算法中,我们分析了在具有综合性医院和专科医院的复杂医疗物联网场景下的业务需求,设计了基于不同任务类型的可拓展的联邦区块链模型,边缘结点部署在各医院之间,根据任务类型进行去中心化的个性化训练或集中式训练。此外,我们采用异构联邦学习,加入近端项以限制本地模型相对于全局模型的偏离程度,加快模型收敛,又允许结点进行"不精确"本地训练,以解决系统异构及统计异构问题。并且,我们将联邦学习算法与差分隐私结合,在本地数据集及上传模型参数时加入高斯白噪声,在区块链中,我们采用委员会共识机制,以达到对投毒攻击、模型梯度倒推、恶意结点攻击、中心服务器攻击的防御。

2、为实现上述目的,本专利技术是根据以下技术方案实现的:

3、一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,预设两种训练任务:训练任务一,针对分类相关性强的数据分析;训练任务二,面向群体的数据分析,包括以下步骤:

4、步骤s1:训练任务下发,模型计算服务器生成初始化模型,根据本地用户数据通过联邦异构算法训练本地模型得到第一轮模型训练的模型参数;

5、步骤s2:各结点通过区块链结点服务器从区块链中获取其他结点模型参数,根据数字签名机制验证其参数是否被恶意篡改,若通过验证,则将模型参数传给模型计算服务器,模型计算服务器计算其他结点与本结点的模型相似度,基于模型相似度选择出与自身模型相似度高的结点进行聚簇;

6、步骤s3:选择每个簇中模型相似度最大的结点组成初始委员会,初始委员会将自身模型参数作为簇内全局模型下发,簇内节点下载簇内全局模型,并利用自身数据集进行本地训练;

7、步骤s4:簇内结点将更新后的模型参数发送给初始委员会;初始委员会利用自身数据集对其余结点的更新进行验证,达成共识后,获取最新区块内容中其余参与结点的模型参数,计算模型相似度,并根据模型相似度为各结点模型参数分配不同权重进行簇内全局模型聚合,其中,只有合格的更新可以被加到区块链上;

8、步骤s5:下一轮训练开始前,选举上一轮训练中簇头结点作为新的委员会,保证委员会不会连选连任,减少恶意结点混入委员会导致模型聚合偏离正确方向的可能;

9、步骤s6:若为训练任务二,则在步骤s5的基础上将簇头结点的模型参数进行聚合得到全局模型;

10、步骤s7:重复步骤s3-s6直至模型收敛。

11、上述技术方案中,所述训练的方法为通过加入差分隐私的fedprox算法。

12、上述技术方案中,所述训练的最优化指标即结点k在第t轮的训练目标是近似最小化以下目标函数:

13、

14、s.t.

15、

16、

17、

18、其中,wt是结点在第t次聚合的模型参数,μ是近端项超参数,fk(w)是各节点的损失函数;c1为函数h的梯度,当满足c2时,定义w*是minwh(w;w0)的一个λ-不精确解,λ越小精度越高。本文档来自技高网...

【技术保护点】

1.一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,预设两种训练任务:训练任务一,针对分类相关性强的数据分析;训练任务二,面向群体的数据分析,包括以下步骤:

2.根据权利要求1所述的一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,所述训练的方法为通过加入差分隐私的FedProx算法。

3.根据权利要求2所述的一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,所述训练的最优化指标即结点k在第t轮的训练目标是近似最小化以下目标函数:

4.根据权利要求3所述的一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,所述步骤S2中的模型相似度的计算方法为:

5.根据权利要求4所述的一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,所述步骤S6中全局模型的具体计算方法为:

【技术特征摘要】

1.一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,预设两种训练任务:训练任务一,针对分类相关性强的数据分析;训练任务二,面向群体的数据分析,包括以下步骤:

2.根据权利要求1所述的一种基于联邦区块链的医疗数据分析用可扩展个性化异构方法,其特征在于,所述训练的方法为通过加入差分隐私的fedprox算法。

3.根据权利要求2所述的一种基于联邦区块链的医疗数据分...

【专利技术属性】
技术研发人员:崔业佳袁晓铭徐泽瑞苏静怡高培森蒲荣赖秀红
申请(专利权)人:东莞市松山湖中心医院东莞市石龙人民医院东莞市第三人民医院东莞市心血管病研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1