基于联邦学习实现医疗数据的隐私保护系统技术方案

技术编号：36218284 阅读：52 留言：0更新日期：2023-01-04 12:15

本发明专利技术公开了一种基于联邦学习实现医疗数据的隐私保护系，涉及医疗数据管理技术领域，包括医疗终端设备、医疗边缘服务器和医疗云中心服务器；医疗终端设备可通过变分建模对医疗数据进行预处理以实现隐私增强并得到模型训练数据；医疗边缘服务器用于将模型训练数据传入多模态模型，筛选得到生命体征区域特征，对全局医疗模型进行训练，得到局部模型，在局部模型梯度中加入本地微分扰动噪声；初始化和更新全局医疗模型。本发明专利技术为基于联邦学习的云边、智能、安全、可信的架构，能实现云边智能协同下的医疗模型训练；实现了医疗数据多模态融合的细粒度分类，提高了模型的准确率；将变分建模和差分隐私集成到系统架构中，确保医疗数据的高机密性。数据的高机密性。数据的高机密性。

全部详细技术资料下载

【技术实现步骤摘要】
基于联邦学习实现医疗数据的隐私保护系统

[0001]本专利技术涉及医疗数据管理
，具体而言，涉及一种基于联邦学习实现医疗数据的隐私保护系统。

技术介绍

[0002]随着机器学习技术时代的到来和可穿戴传感器的快速发展，医疗物联网(IoMT)赋能医疗保健实现智能诊疗，人工智能范式有力推动了医疗保健的发展。医疗数据采集主要依靠智能医疗传感器，如智能手环、亮带等可穿戴设备，传感器采集和预处理数据后，将其传输到云计算中心进行数据分析，形成辅助诊断和治疗的相关模型。但是，由于现在几乎所有IoMT设备中的处理都以经典形式(集中计算)或基于云服务执行，所以我们无法在设备中很好地应用机器学习方法。具体来说，主要存在以下问题：
[0003]1、云计算模型下的机器学习存在相当大的通信延迟，不能很好的将数据传递给用户。用户设备也存在计算资源不足的问题。这些都需要一个新的分布式模型范式来解决。
[0004]2、由于不同医疗传感器上传的数据集差异巨大，获取准确的诊疗模型较为复杂，模型的准确性有待提高。
[0005]3、医疗云中心服务器不可信，通信网络错综复杂。因此，共享医疗数据存在隐私泄露的风险。
[0006]针对上述问题，有学者提出用分布式边缘计算架构替代云计算架构，将模型训练任务卸载到医疗边缘服务器，以实现模型的高效训练；同时结合联邦学习架构，只在传感器端进行数据采集和预处理，来有效解决传感器计算能力有限和医疗数据之间的“数据孤岛”问题。Kairouz等人上传预处理数据并使用医疗边缘服务器资源训练医疗模...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习实现医疗数据的隐私保护系统，其特征在于，包括医疗终端设备、医疗边缘服务器和医疗云中心服务器；所述医疗终端设备用于实时采集来自患者的医疗图像数据，通过变分建模对医疗数据进行预处理以实现隐私增强并得到模型训练数据，以及将模型训练数据传输给所述医疗边缘服务器；所述医疗边缘服务器用于从所述医疗云中心服务器获取需要训练的全局医疗模型，将模型训练数据传入多模态模型，筛选得到生命体征区域特征，利用生命体征区域特征对全局医疗模型进行训练，得到局部模型，在局部模型梯度中加入本地微分扰动噪声，以及将加入本地微分扰动噪声的局部模型梯度发送给所述医疗云中心服务器；所述医疗云中心服务器用于生成最初的全局医疗模型，并下发至各所述医疗边缘服务器，以进入第一轮联邦学习，接收并聚合各加入本地微分扰动噪声的局部模型梯度，得到全局模型梯度，并向全局模型梯度中添加全局噪声，使用添加全局噪声后的全局模型梯度更新全局医疗模型参数，生成新的全局医疗模型，当新的全局医疗模型收敛时，则联邦学习结束，否则将新的全局医疗模型下发至各所述医疗边缘服务器，以进入下一轮联邦学习。2.根据权利要求1所述的系统，其特征在于，所述医疗终端设备为智能医疗传感器。3.根据权利要求1所述的系统，其特征在于，所述医疗云中心服务器还用于监控医疗边缘服务器集群的状态，管理所述医疗终端，备份培训和诊断数据。4.根据权利要求1所述的系统，其特征在于，变分建模的过程包括：使用全连接网络E隐藏医疗数据x得到隐藏数据z；将隐藏数据z输入概率编码器B得到近似概率分布b；将近似概率分布b输入解码器D得到模型训练数据。5.根据权利要求1所述的系统，其特征在于，所述医疗边缘服务器采用多模态模型捕获模型训练数据中最具区分度的区域，并排除模型训练数据的背景噪声，得到生命体征区域特征。6.根据权利要求5所述的系统，其特征在于，通过多模态模型筛选得到生命体征区域特征的过程包括以下步骤：S1、对模型训练数据的两个模态分别进行编码，得到两个模态的编码特征e
a
，e
v
；S2、将两个模态的编码特征e
a
，e
v
进行多模态交叉解码得到融合特征；S3、将融合特征传入细粒度筛选模块，筛选得到生命体征区域特征。7.根据权利要求6所述的系统，其特征在于，步骤S1中，在编码前，需通过卷积池对模型训练数据进行多模态处理，之后再进行编码，编码公式如下：υ1a1＝Conυ2d(υ0，a0)υ2，a2＝MaxPooling(υ1，a1)e
υ
＝E

【专利技术属性】
技术研发人员：王瑞锦，张凤荔，孙鑫，周世杰，谭婧，王雯，赖金山，张志扬，刘东，孙鹏钊，
申请(专利权)人：四川大学华西医院，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人