一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法技术

技术编号:39004560 阅读:10 留言:0更新日期:2023-10-07 10:36
本发明专利技术公开了一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法,其特征在于,包括以下步骤:获取用于模型训练的临床数据;对所获得的临床数据进行预处理并进行肺结节标注;建立机器学习模型;建立基于深度学习框架的AI模型;建立融合模型。本发明专利技术基于肺腺癌瘤体CT图像研究术前精准预测STAS,探讨CT图像与STAS之间的关联性;通过建立并对比传统机器学习模型、基于DL的AI模型以及融合模型,选择诊断效能最优、泛化性最佳的预测模型,构建基于CT图像高诊断效能的肺腺癌STAS术前预测模型,运用于真实世界临床实践及研究,为肺腺癌精准个体化治疗方案提供有价值的辅助决策支持。个体化治疗方案提供有价值的辅助决策支持。个体化治疗方案提供有价值的辅助决策支持。

【技术实现步骤摘要】
一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法


[0001]本专利技术涉及一种深度学习模型建立方法,尤其涉及一种用于精准诊断肺腺癌气腔内播散的深度学习模型的建立方法。

技术介绍

[0002]肺癌是全世界癌症死亡的主要原因,研究分析可能与肺癌独特的侵袭方式有关。气腔内播散(Spread Through Air Space,STAS)是指团簇状或单个肿瘤细胞超出肺肿瘤的边界进入周围肺实质的气腔内,在2015年STAS被首次提出可能是肺癌侵犯周围脏层胸膜或血管的新途径,并被纳入肺癌2015WHO分类中。已经有研究表明,STAS和肺癌患者的复发、生存率及预后有密切的关系,并进而提出肺癌的手术方式可以依据是否存在STAS进行针对性选择。Hu等连续性纳入500例肺腺癌患者,其中STAS阳性率为26.8%(134例),多因素分析结果显示STAS与肿瘤的T分期、N分期、分化中等/差及淋巴血管浸润相关(P值分别是0.001、0.032、0.001、0.001)。Mantovani等人在一项涉及109例肺腺癌的研究中发现STAS的阳性率是64.2%(70例),在小于2cm的N0期肺腺癌病例中STAS和长期生存负相关。Ren等研究表明,对于STAS阳性的1A期肺腺癌患者如果进行肺段或亚段切除则预后较差,而进行肺叶切除则预后大大提高。但是,目前只能通过手术病理的方式术后诊断STAS,具有滞后性,另术中冰冻切片检测STAS的重复性和准确性仍然有限。Villalba等研究了100例1期肺腺癌的手术冰冻切片,结果显示手术冰冻切片有很高的特异性(91%)和较高的准确性(71%),但是灵敏度低(44%),诊断效能曲线下面积(area under the cure,AUC)只有0.67。因此,如果可在术前准确预测肺癌患者的STAS状态,可为临床医生提供重要信息,辅助设计针对性手术治疗方案,既可避免无效的肺切除,也可以提高患者预后。
[0003]目前关于STAS的术前预测研究几乎都是基于影像的肿瘤内部特征,但是STAS作为一种肿瘤侵袭性生物学行为,是直接表现于肿瘤边缘的病理学现象,因此基于肺癌的瘤周图像研究理论上可以更准确地预测STAS。Kadota等研究表明,STAS距肿瘤边缘的中位距离为1.5mm(范围为0.2

8.5mm),肿瘤外5mm的边缘可覆盖约90%存在STAS的病例。在最近一项研究中,Dai等研究表明肺结节边缘与STAS之间的最大距离范围是0.87

1.35cm。本团队在前期工作中,选择肺结节外5、10、15mm瘤周区域分别构建STAS预测模型,均取得了较好的预测效果,但Hosmer

Lemeshow检验结果显示验证集的校准曲线拟合度较差。由于扫描技术的限制,CT图像的肿瘤边缘与实际病理的肿瘤边缘并不能完全重合。Chan等研究表明基于CT图像的肺结节分割可能会高估肿瘤边缘,即分割边缘会超过实际病理上的肿瘤边缘。所以在我们的前期研究中,瘤周区域的勾画存在缺陷,并不能完全包含全面的瘤周信息,需要更准确的深入研究。
[0004]迄今为止,许多研究致力于基于CT图像的传统影像组学特征和机器学习方法术前预测STAS。肺腺癌的CT特征已被研究用于预测STAS的存在,一些研究报道STAS与结节直径、毛刺征、结节类型、边界、空泡和血管异常显著相关。然而,CT特征的评估在很大程度上依赖于放射科医生的主观解释。传统的影像组学作为一种表征算法,通过提取和分析大量高通
量的定量图像特征,为病变的生物行为表征提供了一种无创评估方法。我们在前期工作中,结合肺腺癌患者的临床信息和影像组学,采用多变量logistic回归建立了放射组学nomogram预测模型,旨在术前预测STAS是否存在,研究结果显示其在内部验证集的AUC为0.99[95%置信区间(confidence interval,CI),0.97

1.00]。Li等建立了一个logistic回归模型(包括年龄、最大直径和实性成分比例)来预测肺腺癌患者的STAS,其AUC为0.692(95% CI:0.518

0.866)。传统影像组学研究虽然可以获得高预测效能,但需要经过严格的图像获取、分割、特征提取和模型建立与验证等步骤,操作繁琐、耗时。此外,提取的特征大多由数学公式定义,容易受到噪声、人工分割和CT扫描参数的影响,进而常难以整合到快速的临床工作流中发挥实际作用。
[0005]相较于传统影像组学的特征分析方法,深度学习(deep learning,DL)框架可根据目标分类任务实现特征的自动提取与选择,进而实现端到端全智能的特征学习与提取。DL,如卷积神经网络(convolutional neural network,CNN),可以学习医学图像数据集之间高度复杂的线性/非线性相关性,具有基于数据集的非经验图像特征的优势。DL是以深度神经网络为基础建立的一系列端对端学习的网络构架,可以提供完全自动化的感兴趣区分割、在训练过程中提取特征,在不需要外部特征选择和分类器的情况下进行分类。已经有众多肺腺癌STAS相关的研究会纳入CT征象,结果表明STAS与结节大小、结节类型、毛刺征、空泡和血管异常等有显著相关。我们在前期工作中,发现表皮生长因子受体(Epidermal Growth Factor Receptor,EGFR)突变和NapsinA表达与STAS有着显著相关性(P值分别是0.004和0.001)。如果将肺腺癌病例的影像组学与组织病理学进行相关性研究,可能会增加其预测模型可解释性。

技术实现思路

[0006]本专利技术的目的是:提供一种用于术前精准诊断肺腺癌气腔内播散的模型的建立方法。
[0007]为了达到上述目的,本专利技术的技术方案是提供了一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法,其特征在于,包括以下步骤:
[0008]步骤1、获取用于模型训练的临床数据:
[0009]基于纳排标准回顾性搜集某单位的历史的有手术病理证实STAS阳性的肺腺癌患者的临床数据,临床数据包括患者信息数据以及患者DICOM图像数据,并按年龄和性别1:1匹配纳入STAS阴性肺腺癌患者的临床数据,构建训练数据集;
[0010]根据同一纳排标准,从另一单位选取肺腺癌患者,获取其临床数据构建外部验证集;
[0011]步骤2、对步骤1所获得的临床数据进行预处理并进行肺结节标注:
[0012]预处理包括对DICOM图像数据的预处理,进一步包括以下步骤:
[0013]将DICOM图像数据重采样为指定分辨率图像,随后对DICOM图像数据进行差值处理,再针对对不同设备和不同扫描参数的DICOM图像数据,结合迁移神经网络的方法进行处理,产生归一化的差别变异范围较小的影像数据;
[0014]在经过预处理的DICOM图像数据上进行肺结节标注,标注肺结节的形态学特征包括:结节大小;毛刺,结节边缘呈针状、放射状无分枝线状影;分叶征;瘤肺界面;空洞;空泡;
空气支气管征;胸膜凹陷本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法,其特征在于,包括以下步骤:步骤1、获取用于模型训练的临床数据:基于纳排标准回顾性搜集某单位的历史的有手术病理证实STAS阳性的肺腺癌患者的临床数据,临床数据包括患者信息数据以及患者DICOM图像数据,并按年龄和性别1:1匹配纳入STAS阴性肺腺癌患者的临床数据,构建训练数据集;根据同一纳排标准,从另一单位选取肺腺癌患者,获取其临床数据构建外部验证集;步骤2、对步骤1所获得的临床数据进行预处理并进行肺结节标注:预处理包括对DICOM图像数据的预处理,进一步包括以下步骤:将DICOM图像数据重采样为指定分辨率图像,随后对DICOM图像数据进行差值处理,再针对对不同设备和不同扫描参数的DICOM图像数据,结合迁移神经网络的方法进行处理,产生归一化的差别变异范围较小的影像数据;在经过预处理的DICOM图像数据上进行肺结节标注,标注肺结节的形态学特征包括:结节大小;毛刺,结节边缘呈针状、放射状无分枝线状影;分叶征;瘤肺界面;空洞;空泡;空气支气管征;胸膜凹陷征;肺血管异常,包括血管集束征和血管膨大;纵隔肺门淋巴结肿大,短径大于1cm,无钙化;标注流程多轮次分组交叉进行:首先对肺癌病灶区域进行勾画,然后对患者数据根据病理诊断结果进行分类分型,最终形成能够对模型进行训练的标注数据集;步骤3、建立机器学习模型:建立多种机器学习模型,通过单因素和多因素分析从步骤2所标注的形态学特征中筛选出与肺腺癌STAS相关的独立预测因子作为各机器学习模型的输入数据,对所建立的所有机器学习模型对比之后选择诊断效能最佳的一个机器学习模型;步骤4、建立基于深度学习框架的AI模型:基于各种不同的ResNet结构建立多个AI模型,AI模型的输入为经过处理的DICOM图像数据,对DICOM图像数据的处理方法进一步包括以下步骤:将DICOM图像数据的体素间距归一化为1
×1×
1mm,然后以DICOM图像数据中标注的肺结节为中心裁剪得到固定大小的立方体,最后进行随机旋转,裁剪后的立方体始终能够包含整个肺结节;对所建立的所有AI模型对比之后选择诊断效能最佳的一个AI模型;步骤5、建立融合模型:融合步骤3建立的机器学习模型与步骤4建立的AI模型,获得融合模型。2.如权利要求1所述的一种精准诊断肺腺癌气腔内播散的深度学习模型建立方法,其特征在于,所述纳排标准包括纳入标准以及排除标准,其中:纳入标准包括:平扫期薄层CT图像质量优,满足层厚≤2mm、深吸气相、无运动伪影、肺窗重建;术前一个月内有连续薄层胸部CT图像;腺癌术后病理诊断明确;病灶最大横截面最大径≤3cm;每组纯磨玻璃结节不超过病例总数的20%,≤1cm纯磨玻璃结节不超过病例总数的10%,每组≥2cm结节不少于病例总数的50%;排除标准包括:明显成像伪影;呼吸运动伪影;术前有新辅助化疗;低剂量CT图像,满足单次剂量低于1.5mSv...

【专利技术属性】
技术研发人员:卓瑶瑶单飞刘雷张志勇王云鹏王青乐范卓阳曾蒙苏
申请(专利权)人:复旦大学附属中山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1