多中心基于联邦学习的脑肿瘤预后生存期预测方法及系统技术方案

技术编号:30541578 阅读:56 留言:0更新日期:2021-10-30 13:19
本发明专利技术提供了一种多中心基于联邦学习的脑肿瘤预后生存期预测方法及系统,利用多中心的多模态脑肿瘤影像及其组学信息,患者临床病历信息等多尺度信息进行脑肿瘤预后生存期预测,提出了一种基于主动学习与强化学习的多中心联邦学习机制。本发明专利技术通过各中心分布式存储的患者电子病历信息联合影像组学特征与深度学习特征建立全面的脑肿瘤预后生存期分类模型,在保证患者图像数据隐私的基础上实现可靠的、准确度更高的脑肿瘤预后生存期预测系统。准确度更高的脑肿瘤预后生存期预测系统。准确度更高的脑肿瘤预后生存期预测系统。

【技术实现步骤摘要】
多中心基于联邦学习的脑肿瘤预后生存期预测方法及系统


[0001]本专利技术涉及医学图像辅助诊断领域,具体地,涉及一种多中心基于联邦学习的脑肿瘤预后生存期预测方法及系统。

技术介绍

[0002]脑肿瘤是人体常见的肿瘤,我国脑肿瘤的患病率约为32/10万,占全身肿瘤发病率的6.31%,包括胶质瘤、淋巴瘤和转移瘤等。在医疗数字化时代,根据肿瘤临床诊疗需求,利用脑肿瘤多模态核磁共振影像技术从多模态MRI扫描中准确分割脑肿瘤的不同亚区,如水肿区、坏死核心、增强和非增强的肿瘤核心,对脑瘤的诊断、预后和治疗具有重要的临床意义。现阶段,影像科医生主要依照个人知识和经验对检查结果中脑肿瘤的进行主观、定性的分级诊断,而且诊断的结果意见也都是包含简单的量化信息,不能描述出全面的脑肿瘤信息,这不利于医生制定治疗方案。脑肿瘤患者肿瘤复发的准确识别对于选择治疗策略至关重要,早期准确的术后肿瘤复发预测可以为确定辅助治疗提供有价值的信息。脑肿瘤的预后通常以总生存期(Overall Survival,OS)来衡量,而OS在很大程度上因人而异。因此,及时准确地预测脑瘤患者的OS时间具有重要的临床意义,并有利于个体化的治疗护理。
[0003]在医疗图像分析领域,由于患者医疗数据的高度敏感性,数据仅保存在各医院本地,研究人员遇到数据碎片化和数据孤岛问题,所以原始数据完全不会离开拥有者的本地设备,而联邦学习框架则成了数据敏感场景下进行模型训练较好的选择之一。基于医疗联邦学习框架,能够在保证不同医疗机构数据隐私的基础上共同学习建模并更新参数,可以有效改善共享模型的性能,从而解决医疗行业数据安全与隐私保护难题,缓解医疗资源不均衡问题。
[0004]但是,现有的联邦学习方法通常采用单一的全局模型,仅通过聚合各个客户端模型参数来获取所有用户的共享知识,而不考虑不同中心的数据分布之间的差异。由于用户行为的多样性,将本地模型的梯度分配给不同的全局模型可以更好地捕获数据分布的异构性。主动学习是一种新型学习策略,它允许学习算法以交互方式查询信息源,以选择和标记新的训练样本,同时通过在一个非常小的人工标注数据集上训练的模型,从大量未标注样本中自动标注训练样本,从而简化标注过程,为选择对模型更有意义的高质量样本提供了一种的解决方案。
[0005]在公开号为CN110444263A的专利文献中,公开了一种基于联邦学习的疾病数据处理方法、装置、设备及介质,所述方法包括:获取本地数据库中已确诊病患的电子健康记录和所患疾病数据;对所述电子健康记录进行特征提取,得到各病患的患病特征向量;根据各病患的所述患病特征向量和所述所患疾病数据构建本地训练样本集;基于所述本地训练样本集参与各医院数据端的联邦学习,得到患病预测模型。本专利技术通过将各医院端的数据联合起来,进行联邦训练,在不泄露医院端病患隐私的基础上,能够训练出优质的患病预测模型,从而在医生的诊断过程发挥积极的辅助作用。

技术实现思路

[0006]针对现有技术中的缺陷,本专利技术的目的是提供一种多中心基于联邦学习的脑肿瘤预后生存期预测方法及系统。
[0007]根据本专利技术提供的一种多中心基于联邦学习的脑肿瘤预后生存期预测方法,包括以下步骤:
[0008]步骤S1:构建基于多中心联邦学习的客户端

服务器体系结构的联邦学习模型;所述联邦学习模型基于主动学习策略来最小化所有设备的总损失;
[0009]步骤S2:在各客户端本地,采集脑肿瘤的原始医学图像,并对采集的图像做统一化和去隐私化处理,获得脑肿瘤医学肿瘤影像数据和历史肿瘤数据;
[0010]步骤S3:建立脑肿瘤医学肿瘤多模态影像数据库,并通过神经网络算法建立脑肿瘤分割模型,取脑肿瘤医学肿瘤多模态影像数据库中一个脑肿瘤医学图像样本,提取脑肿瘤医学图像样本中的脑肿瘤特征;
[0011]步骤S4:对步骤S3中提取的脑肿瘤特征进行分析,从提取的特征中选择最有用的预测特征,选定预测特征的线性组合计算患者的放射组学评分;
[0012]步骤S5:重复步骤S2至步骤S4,形成训练集,结合机器学习模型最终生成最终生存期的三分类模型,为患者脑肿瘤预后生存期进行分类预测。
[0013]优选的,所述步骤S1中的联邦学习模型包括客户端模型训练、服务器模型聚合以及客户端隐私保护模块。
[0014]优选的,所述步骤S1中,不同的客户端使用相同的深度网络模型作为底层联邦模型M
i
,M
i
是由权重W
i
参数化的模型,本地私有脑肿瘤数据训练集D
i
={X
i
,Y
i
},第i个客户端有m
(i)
的数据样本,服从数据分布p
(i)
,该数据分布是该客户端上样本{X
i
,Y
i
}的联合分布,本地模型训练过程可表示为:X
i
表示第i个客户端的样本特征,Y
i
表示第i个客户端的样本标签,L()表示需要最小化的损失函数,arg min f(x)表示使目标函数f(x)取最小值时的变量值,模型训练过程中将各本地模型分成K个簇,每个簇对应的中心模型为
[0015]优选的,所述步骤S1中,全局联邦学习目标是最小化全局模型和具体模型之间的距离,损失函数使用多中心基于距离的联邦损失(Multi

center DF

Loss),定义为:
[0016][0017]式中,m表示客户端的总个数,表示每个簇对应的中心模型参数,其中Dist()函数用于度量本地模型参数W
i
与服务器模型参数之间的相似性,距离度量函数使用:||
·
||2表示L2范数。
[0018]优选的,多中心基于距离的联邦损失在优化过程中具有动态变化的W
i
,增加更新W
i
步骤,具体包括:
[0019]步骤S1.1:用固定W
i
更新簇分配变量;
[0020]步骤S1.2:更新簇中心
[0021]步骤S1.3:通过提供新的初始化更新局部模型。
[0022]优选的,所述步骤1中主动学习的基本目标是从本地客户端上新增的未标记脑肿瘤多模态MRI图像池中获取和标记培训样本;客户端隐私保护模块通过将客户端设计为享有要共享数据的完全控制权,本地训练的数据不离开客户端。
[0023]优选的,所述步骤1中服务器分发一个全局模型,并在每一次联合轮次中从所有的客户端接收同步更新。
[0024]优选的,所述步骤1中当有多个客户端本地数据样本更新时,采用深度强化学习问题构建马尔科夫决策过程进行全局模型的参数更新。
[0025]优选的,所述步骤S4中,通过最小绝对收缩和选择算子LASSO方法进行特征选择预测特征,LASSO回归是以缩小变量集为思想的压缩估计方法,LASSO的公式为:
[0026][0027]其中ψ是特征系本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多中心基于联邦学习的脑肿瘤预后生存期预测方法,其特征在于,包括以下步骤:步骤S1:构建基于多中心联邦学习的客户端

服务器体系结构的联邦学习模型;所述联邦学习模型基于主动学习策略来最小化所有设备的总损失;步骤S2:在各客户端本地,采集脑肿瘤的原始医学图像,并对采集的图像做统一化和去隐私化处理,获得脑肿瘤医学肿瘤影像数据和历史肿瘤数据;步骤S3:建立脑肿瘤医学肿瘤多模态影像数据库,并通过神经网络算法建立脑肿瘤分割模型,取脑肿瘤医学肿瘤多模态影像数据库中一个脑肿瘤医学图像样本,提取脑肿瘤医学图像样本中的脑肿瘤特征;步骤S4:对步骤S3中提取的脑肿瘤特征进行分析,从提取的特征中选择最有用的预测特征,选定预测特征的线性组合计算患者的放射组学评分;重复步骤S2至步骤S4的执行,直到形成训练集;步骤S5:根据所述训练集,结合机器学习模型最终生成最终生存期的三分类模型,为患者脑肿瘤预后生存期进行分类预测。2.根据权利要求1所述的多中心基于联邦学习的脑肿瘤预后生存期预测方法,其特征在于:联邦学习模型包括客户端模型训练、服务器模型聚合以及客户端隐私保护模块。3.根据权利要求1所述的多中心基于联邦学习的脑肿瘤预后生存期预测方法,其特征在于:所述步骤S1中,第i个客户端使用相同的深度网络模型作为底层联邦模型M
i
,M
i
是由权重W
i
参数化的模型,与第i个客户端对应的本地私有脑肿瘤数据训练集D
i
={X
i
,Y
i
},X
i
表示第i个客户端的样本特征,Y
i
表示第i个客户端的样本标签,第i个客户端有的数据样本m
(i)
,服从数据分布p
(i)
,该数据分布是该客户端上样本{X
i
,Y
i
}的联合分布,本地模型训练过程可表示为:式中,W
i

表示第i个客户端经训练后得到的最优本地模型权重,表示使损失函数L()最小化时的模型权重W
i
,L()表示需要最小化的损失函数,arg min
·
表示使目标函数
·
取最小值时的变量值,模型训练过程中将各本地模型分成K个簇,第k个簇对应的中心模型为4.根据权利要求1所述的多中心基于联邦学习的脑肿瘤预后生存期预测方法,其特征在于:所述步骤S1中,全局联邦学习目标是最小化全局模型和具体模型之间的距离,损失函数使用多中心基于距离的联邦损失,定义为:式中,L表示需要最小化的损失函数,m表示客户端的总个数,表示每个簇对应的中心模型参数,其中Dist()函数用于度量本地模型参数W
i
与服务器模型参...

【专利技术属性】
技术研发人员:于泽宽耿道颖项睿刘晓李郁欣陈卫强李强尹波张军杜鹏
申请(专利权)人:复旦大学附属华山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1