System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种隐私保护的跨医院疾病数据分析方法技术_技高网

一种隐私保护的跨医院疾病数据分析方法技术

技术编号:42628305 阅读:13 留言:0更新日期:2024-09-06 01:30
本发明专利技术涉及一种隐私保护的跨医院疾病数据分析方法,具体如下:步骤1:获取多站点脑影像数据集,步骤2:根据静息态功能连接矩阵构建脑网络,步骤3:利用站点内的对比学习提取每个站点各自的特有特征,步骤4:利用站点间的对比学习提取不同站点的共性特征,步骤5:最小化双通道特征提取器提取的特征的互信息,步骤6:利用提取的特征对样本进行分类,步骤7:构建多站点间的拓扑关系图,步骤8:根据贡献度聚合全局模型,步骤9:服务器将全局模型参数传输至各个站点,替换本地模型参数。该方案有效缓解了联邦学习中跨站点非独立同分布医疗数据对模型分类效果的影响,实现最优聚合,保护了敏感数据,还在跨站点数据的异质性上做了深入优化。

【技术实现步骤摘要】

本专利技术涉及一种数据分析方法,具体涉及一种隐私保护的跨医院疾病数据分析方法,属于数据分析。


技术介绍

1、在医疗保健领域,患者数据采集和标注成本高,单个站点数据有限,导致深度模型诊断准确率和泛用性不高。多站点方法汇集数据解决“数据孤岛”问题,提升诊断准确率和模型泛用性。然而,数据共享可能导致隐私泄露,给多站点联合训练带来挑战。联邦学习算法能够在只传输模型参数的前提下保护患者的隐私,但在处理异构数据时会出现客户端漂移现象,模型的泛用性与分类效果不能得到有效提高,全局模型无法得到有效聚合。

2、与单点方法相比,多站点分析方法能够通过整合从不同医院或设备收集的样本或知识来提高医学诊断模型的性能。然而,由于不同站点之间的数据共享也给医疗数据的隐私保护带来了巨大挑战。随着公众对个人隐私数据的日益关注和更严格的隐私保护法的实施,迫切需要开发精确且保护医疗隐私的多站点诊断模型。

3、联邦学习能够在不同站点之间进行协作模型训练,同时保护用户隐私。这是通过在本地设备上进行模型训练来实现的,而无需将原始数据传输到中央服务器。作为最广泛采用的联合学习方法,fedavg使用本地数据训练模型并将模型参数传输到中央服务器。服务器聚合模型参数,计算全局模型的平均值,然后将结果发送回本地设备以更新模型。联邦学习在医学数据处理领域越来越受到关注。例如,联合条件相互学习(fedcm)方法通过考虑站点的局部性能和站点之间的相似性来提高阿尔茨海默病的诊断性能。联邦森林(fedefo)模型通过使用具有数据隐私保护的smri图像来计算ad分类的海马体积。现有技术中虽然公开了一种联邦学习方法,该方法实现了分散迭代优化算法,并通过随机化机制改变共享的局部模型权重。但是,上述方法是在来自不同站点的数据独立且相同分布(iid)的假设下进行的。然而,在大多数多站点医疗数据分析问题中,非iid数据普遍存在,通常会导致客户端漂移的现象。因此,迫切需要研究稳健的联邦多站点方法,使聚合模型能够弥补站点之间数据分布差异造成的差距,从而提高其预测性能。

4、最近,许多研究致力于减轻不同站点之间非iid问题对联合学习方法的影响。例如,fedprox结合了近端项,以限制在局部训练后获得的模型参数与全局模型参数的距离不太远。scaffold引入了带有模型更新方向信息的服务器和站点控制变量,旨在通过在局部模型的更新方程中添加校正项来缓解客户端漂移问题。moon方法在优化的特征空间中对齐全局和局部模型的表示。尽管上述方法同时考虑了全局和局部语义对齐,但在私有模型的训练和全局模型的聚合过程中,它们忽略了增强特征可分辨性,难以实现最优的联邦诊断模型。

5、就联邦聚合而言,典型的联邦算法fedavg按样本比例对聚合模型参数进行平均。但在非iid情况下,常常无法实现有效聚合。许多研究方法试图利用反映站点之间数据差异的关键信息进行模型聚合。例如,基于hessian矩阵的模型聚合策略考虑了质量变化,并根据模型收敛速度为本地站点模型的每个参数分配权重。

6、为了解决这些问题,我们提出了一个具有对比特征增强的联合学习方法,用于稳健的多站点脑疾病诊断。该方法有效地缓解了异构数据导致的客户端漂移问题,同时增强了不同医疗站点或医院的隐私保护。


技术实现思路

1、本专利技术正是针对现有技术中存在的技术问题,提供一种隐私保护的跨医院疾病数据分析方法,该方法仅需在站点之间传输模型参数和梯度信息,而无需传输患者信息,从而有效保护患者隐私。此外,通过站点内与站点间的对比学习和基于多站点拓扑关系的联邦聚合策略,有效缓解了联邦学习中跨站点非独立同分布医疗数据对模型分类效果的影响,实现了最优聚合。该方案不仅保护了敏感数据,还在跨站点数据的异质性上做了深入优化。

2、为了实现上述目的,本专利技术的技术方案如下,一种隐私保护的跨医院疾病数据分析方法,所述方法包括以下步骤:

3、步骤1:获取多站点脑影像数据集,并对其进行预处理,得到处理后的静息态功能连接矩阵,

4、首先,对原始的rs-fmri数据进行包括切片定时校正、干扰信号回归和时间滤波的预处理。之后,通过非线性配准算法将导出的rs-fmri归一化到蒙特利尔神经研究所(mni)空间。随后,根据包含90个预定义的感兴趣区域(roi)的解剖自动标记(aal)图谱提取一组大脑区域的平均时间序列。最后,对于每个受试者,我们可以生成一个由对称矩阵表示的静息态功能连接矩阵,其中该矩阵中的每个元素表示一对roi之间的pearson相关系数;

5、步骤2:根据静息态功能连接矩阵构建脑网络,

6、将脑区视为图中的节点,通过阈值对功能连接矩阵中元素做判定,若脑区和脑区的皮尔逊相关系数大于阈值,则表示脑区和脑区有边连接,以此判定图中的边是否存在,将功能连接矩阵的第列数据作为脑区的节点特征。

7、步骤3:利用站点内的对比学习提取每个站点各自的特有特征,

8、为了使模型能够从特定的站点充分提取高质量的特征,使用数据的类别信息来区分正样本和负样本,即具有相同标签的样本是正样本,而具有不同标签的样本则是负样本,这使得相同类别数据的表示集中在特征空间的相邻区域中。具体而言,我们在local通道中应用站点内的对比约束来提取具有增强表示的特征,假设对于锚样本特征,与其标签相同标签的正样本为,与其标签不同标签的负样本为。对比损失函数可以通过以下公式来计算:

9、

10、其中,代表样本总集合,代表正样本集合,代表负样本集合,表示余弦相似性,是sigmoid激活函数,是对比学习中的温度系数。

11、步骤4:利用站点间的对比学习提取不同站点的共性特征,

12、为了缓解非独立同分布数据带来的客户端漂移现象,使用站点间的图对比学习方法,提高全局和局部图结构信息的嵌入表示的互信息,以实现一致的全球和本地目标。具体来说,

13、首先在global通道上获得基于拉普拉斯的图结构嵌入表示,然后,最大化分别从局部模型站点通道和全局模型站点通道提取的特征和的互信息,通过以下等式计算对比损失:

14、,

15、其中是样本总数,是样本中的节点数,是从私有模型的global通道获得的第个节点的节点表示,是从全局模型的global通道获得的图表示。

16、步骤5:最小化双通道特征提取器提取的特征的互信息,

17、为了使双通道特征提取器提取的特征更具鉴别性,将和的jensen-shannon散度约束为最大,以此使它们的互信息最小化。具体来说,

18、通过以下公式计和的信道间损失:

19、,

20、其中,是从local通道提取的图表示,是从global通道获得的图表示。

21、步骤6:利用提取的特征对样本进行分类,首先将提取的个性化特征以及共性特征拼接,组合成样本特征,接着将样本特征输入至多层感知机中进行分类,将样本从特征空间映射至标签空间,以实现脑疾病的分类本文档来自技高网...

【技术保护点】

1.一种隐私保护的跨医院疾病数据分析方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤1:获取多站点脑影像数据集,并对其进行预处理,得到处理后的静息态功能连接矩阵,具体如下,

3.根据权利要求2所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤2:根据静息态功能连接矩阵构建脑网络,具体如下,

4.根据权利要求3所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤3:利用站点内的对比学习提取每个站点各自的特有特征,具体如下:

5.根据权利要求4所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤4:利用站点间的对比学习提取不同站点的共性特征,具体如下:

6.根据权利要求5所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤5:最小化双通道特征提取器提取的特征的互信息,具体如下:

7.根据权利要求6所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤6:利用提取的特征对样本进行分类,首先将提取的个性化特征以及共性特征拼接,组合成样本特征,接着将样本特征输入至多层感知机中进行分类,将样本从特征空间映射至标签空间,以实现脑疾病的分类。

8.根据权利要求7所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤7:构建多站点间的拓扑关系图,在每一轮通信中,不同的站点上传Global通道的梯度信息,服务器保存不同站点不同时段的模型梯度信息,然后通过计算模型梯度时间序列的相似性来捕捉站点之间的拓扑关系,并通过PageRank算法动态评估不同站点模型对联邦聚合的重要性,最后,将每个站点的贡献权重作为联邦聚合中的权重,根据以下公式拼接每个Global通道图卷积层的梯度,并在将其上传到服务器之前计算其2-范数,服务器保留最后轮通信的模型梯度,

9.根据权利要求8所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤8:根据不同站点的贡献度聚合全局模型,使用PageRank根据站点之间的拓扑关系来评估每个站点的贡献,然后,通过幂法计算每个站点的聚合权重:

10.根据权利要求9所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤9:服务器将全局模型参数传输至各个站点,替换本地模型参数,服务器将聚合得到的全局模型参数传输至各个站点,每个站点将本地模型参数替换成全局模型参数,并依次重复步骤3至步骤6,直至各个站点的模型达到目标精度。

...

【技术特征摘要】

1.一种隐私保护的跨医院疾病数据分析方法,其特征在于,所述方法包括以下步骤:

2.根据权利要求1所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤1:获取多站点脑影像数据集,并对其进行预处理,得到处理后的静息态功能连接矩阵,具体如下,

3.根据权利要求2所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤2:根据静息态功能连接矩阵构建脑网络,具体如下,

4.根据权利要求3所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤3:利用站点内的对比学习提取每个站点各自的特有特征,具体如下:

5.根据权利要求4所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤4:利用站点间的对比学习提取不同站点的共性特征,具体如下:

6.根据权利要求5所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤5:最小化双通道特征提取器提取的特征的互信息,具体如下:

7.根据权利要求6所述的一种隐私保护的跨医院疾病数据分析方法,其特征在于,步骤6:利用提取的特征对样本进行分类,首先将提取的个性化特征以及共性特征拼接,组合成样本特征,接着将样本特征输入至多层感知机中进行分类,将样本从特征空间...

【专利技术属性】
技术研发人员:陈枢朱旗李胜荣张道强
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1