多模态概率分布自适应的原发性肝癌病理分级预测方法技术

技术编号:34515124 阅读:65 留言:0更新日期:2022-08-13 21:02
本发明专利技术涉及CT图像处理技术领域,具体涉及一种多模态概率分布自适应的原发性肝癌病理分级预测方法,该方法包括如下步骤:S1、基于特征分布动态对齐和分类层对齐的多源迁移特征提取网络,采用动态的概率分布衡量方法,充分考虑多源医学数据的边缘分布和条件分布差异,实现多源异构特征的细粒度对齐迁移;S2、基于改进型布谷鸟优化极限学习机的肝MR图像特征分类算法实现多源迁移特征的分类。本发明专利技术在有效解决多源数据异构问题的基础上充分融合多源医学数据,丰富特征信息,提取更鲁棒有效的多源迁移特征,并采用改进型布谷鸟算法对极限学习机的隐含层节点数进行自适应寻优,训练更稳定准确的分类器,实现多源迁移特征的有效分类。类。类。

【技术实现步骤摘要】
多模态概率分布自适应的原发性肝癌病理分级预测方法


[0001]本专利技术涉及CT图像处理
,具体涉及一种多模态概率分布自适应的原发性肝癌病理分级预测方法。

技术介绍

[0002]原发性肝癌是全球癌症相关死亡的第四大病因,系我国第四位常见恶性肿瘤及第二位肿瘤致死原因,全球50%的死亡病例数发生在我国,其中肝细胞癌(Hepatocellular Carcinoma,HCC)占比85%~90%。
[0003]手术切除是HCC患者最有效的治疗方法,即便肝癌的诊断和治疗取得许多突破性进展,但肝癌患者的总体生存率仍然很低,其5年生存率仅为18%,术后高复发率是降低总体生存率的最主要因素之一。据统计,肝癌切除术后5年肿瘤复发转移率高达40%~70%。
[0004]HCC肿瘤组织病理学分级与患者预后密切相关,是治疗方案选择及生存预后评估的重要指标。据报道,大多数高级别HCC肿瘤患者的复发风险较高,手术切除时需要更大的安全切缘,且治疗后需要更高频率的随访检查;而低级别HCC患者的复发风险较低。因此,治疗前准确预测HCC病理分级有助于肝癌患者治疗策略的选择并实现个体的精准医疗。
[0005]目前,深度学习因其优异的特征学习能力已成为医学影像诊断分类中首推的计算机辅助诊断技术,在肝癌的分类和预后上得到不断应用。但是深度学习模型的性能取决于大量的训练数据,而在临床实践中,受限于各种条件,比如疾病发生率不同且极为分散、多地多家医院的数据存在厂家、扫描参数不统一等,导致医学影像有效数据集小。为改善医学数据小样本下的深度学习诊断性能,迁移学习技术得到广泛应用,其中基于ImageNet源域数据集预训练后在目标数据上进行参数微调的迁移学习范式最为普遍。然而,研究表明源域和目标域的相似性是决定迁移效果的关键因素,当源域和目标域相关性较低或者不相关时,基于预训练微调范式的迁移学习可能收效甚微。此外,基于ImageNet单一源领域进行迁移,模型主要学习到自然图像的基础纹理特征,使得模型的判别性可能主要倾向于仅有的单一源域表示,泛化性能较差。考虑到临床实践中,医生常常需要借助多种手段进行疾病诊断,例如基于动脉期和静脉期等多序列CT影像进行病灶筛查,然后基于全视野数字切片图像(Whole Slide Images,WSI)进行病理诊断,是否以多模态的的数据为源域数据进行迁移,效果更佳。
[0006]多模态数据的引入带来丰富特征的同时必定带来复杂的差异性,为减少多源数据间的差异,更好的进行特征迁移,多源迁移方法主要有两种学习范式:

基于几何特征变换迁移法和

统计特征变换迁移法,其中几何特征变换法主要关注数据的空几何空间结构,通过构建合适的变换子空间,消除多源域数据之间的差异。例如,Li等人利用大型的开源医学数据集和小型本地医学数据集为源域数据,基于奇异值分解方法构建多源域特征子空间,然后在特征子空间内利用Bregman散度衡量源域数据和目标域数据之间的分布差异,实现阿尔兹海默症的辅助诊断。Zhang等人以多视图对比增强超声图像(包括动脉期,静脉期,以及延迟期)为源域数据,B型超声图像为目标域数据实现肝癌诊断。该研究针对不同的源
域数据设计多个核函数,将数据映射到不同的高维空间,然后基于均方欧氏距离衡量源域和目标域间的特征差异,实现多源数据迁移。相较于几何特征变换法,基于统计的特征变换方法应用更广泛。例如,Fang等人提出一种多源集成迁移学习框架(Multi

LSTM

DANN),该框架基于最大均值差异(maximum mean discrepancy,MMD)度量不同数据域之间的边缘概率分布,实现多源数据的选择性迁移。Li等人、Wang等面复杂的多源数据,采用联合概率适配(Joint Distribution Adaptation,JDA)同时评估数据的边缘分布和条件分布,减少数据间的分布差异,实现医学图像的分类。
[0007]上述研究基于多源迁移技术,充分利用多模态的医学数据,挖掘更多维度的特征信息,提高模型性能,但仍存在以下问题:(1)面对多模态的医学图像,尝试寻找特定的子空间变换矩阵,将多源域特征映射到公共特征空间后进行特征对齐,通常需要人为设定子空间基向量的维度,具备主观性且不同的基向量维数可能造成数据信息不同程度的丢失。(2)面对多源异构的图像,单纯考虑其单一概率分布,或者以同等地位对齐数据的边缘分布和条件分布差异,未能做到自适应衡量数据的边缘分布(关乎数据产生机制)和条件分布(关乎具体的下游任务)差异,进行细粒度分类迁移。

技术实现思路

[0008]为解决上述问题,本专利技术提供了一种多模态概率分布自适应的原发性肝癌病理分级预测方法,在有效解决多源数据异构问题的基础上充分融合多源医学数据,丰富特征信息,提取更鲁棒有效的多源迁移特征,并采用改进型布谷鸟算法对极限学习机的隐含层节点数进行自适应寻优,训练更稳定准确的分类器,实现多源迁移特征的有效分类。
[0009]为实现上述目的,本专利技术采取的技术方案为:
[0010]多模态概率分布自适应的原发性肝癌病理分级预测方法,包括如下步骤:
[0011]S1、基于特征分布动态对齐和分类层对齐的多源迁移特征提取网络,采用动态的概率分布衡量方法,充分考虑多源医学数据的边缘分布和条件分布差异,实现多源异构特征的细粒度对齐迁移;
[0012]S2、基于改进型布谷鸟优化极限学习机的肝MR图像特征分类算法实现多源迁移特征的分类。
[0013]进一步地,步骤S1中,首先将多源数据输入到公共特征空间提取F(),将公共空间输出特征继续映射到对应的特定域特征空间h(),在特定域特征空间中动态对齐源域和目标域的概率分布差异,寻找各源域与目标域的特异性特征表达基于该特异性特征训练特定域分类器对目标域做出预测;最后,通过最小化源域和目标域特征的分布差异,以及各分类层分类器间差异,依据结构风险最小化原则,构造总的目标函数如下:
[0014][0015]其中,f表示该网络的总误差,等号右侧第一项表示特定域特征空间中源域和目标域特征之间的概率分布差异损失,第二项表示不同域对应分类器预测值间的差异损失,第三项表示特定域分类器的交叉熵分类损失,第四项表示f的2范数约束项,α,β和γ是对应的正则化参数。
[0016]进一步地,步骤S1中,以基于ImageNet预训练的ResNet50作为公共特征提取网络,然后将公共空间输出特征继续映射到对应的特定域特征空间,在特定域特征空间采用最大均值差异动态衡量源域数据和目标域数据之间的概率分布差异,使得分类层的输入特征满足预测模型应用的独立同分布条件。
[0017]进一步地,步骤S1中,采用softmax函数作为特定域分类器对目标域进行分类,然后基于交叉熵记录其分类损失,即:
[0018][0019]其中,x表示原始目标域数据,y表示其对应的标签,J()表示交叉熵损失函数,h
j
(F(x))表示第j组源域对应的特定域特本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.多模态概率分布自适应的原发性肝癌病理分级预测方法,其特征在于:包括如下步骤:S1、基于特征分布动态对齐和分类层对齐的多源迁移特征提取网络,采用动态的概率分布衡量方法,充分考虑多源医学数据的边缘分布和条件分布差异,实现多源异构特征的细粒度对齐迁移;S2、基于改进型布谷鸟优化极限学习机的肝MR图像特征分类算法实现多源迁移特征的分类。2.如权利要求1所述的多模态概率分布自适应的原发性肝癌病理分级预测方法,其特征在于:步骤S1中,首先将多源数据输入到公共特征空间提取F(),将公共空间输出特征继续映射到对应的特定域特征空间h(),在特定域特征空间中动态对齐源域和目标域的概率分布差异,寻找各源域与目标域的特异性特征表达基于该特异性特征训练特定域分类器对目标域做出预测;最后,通过最小化源域和目标域特征的分布差异,以及各分类层分类器间差异,依据结构风险最小化原则,构造总的目标函数如下:其中,f表示该网络的总误差,等号右侧第一项表示特定域特征空间中源域和目标域特征之间的概率分布差异损失,第二项表示不同域对应分类器预测值间的差异损失,第三项表示特定域分类器的交叉熵分类损失,第四项表示f的2范数约束项,α,β和γ是对应的正则化参数。3.如权利要求1所述的多模态概率分布自适应的原发性肝癌病理分级预测方法,其特征在于:步骤S1中,以基于ImageNet预训练的ResNet50作为公共特征提取网络,然后将公共空间输出特征继续映射到对应的特定域特征空间,在特定域特征空间采用最大均值差异动态衡量源域数据和目标域数据之间的概率分布差异,使得分类层的输入特征满足预测模型应用的独立同分布条件。4.如权利要求1所述的多模态概率分布自适应的原发性肝癌病理分级预测方法,其特征在于:步骤S1中,采用softmax函数作为特定域分类器对目标域进行分类,然后基于交叉熵记录其分类损失,即:其中,x表示原始目标域数据,y表示其对应的标签,J()表示交叉熵损失函数,h
j
(F(x))表示第j组源域对应的特定域特征提取子网路输出的目标域图像特征;为降低类边界附近目标样本的错误分类,基于欧氏距离衡量不同子分类器针对同一目标数据的分类差异,构建分类层损失值f
disc
,如下式所示:
综合公式(9)、(10)、(11)和结构风险最小化理论,可得该特征提取网络总损失函数,如下所示:5.如权利要求1所述的多模态概率分布自适应的原发性肝癌病理分级预测方法,其特征在于:步骤S2中,改进型布谷鸟优化极限学习机的肝MR图像特...

【专利技术属性】
技术研发人员:崔恩铭冯宝刘昱马长宜龙晚生徐坤财侍江峰
申请(专利权)人:桂林航天工业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1