一种无创预测EGFR/TP53共突变肺癌患者的人工智能系统技术方案

技术编号:35509160 阅读:11 留言:0更新日期:2022-11-09 14:22
本发明专利技术提供了一种无创预测EGFR/TP53共突变肺癌患者的人工智能系统,属于肺癌预测系统领域。本发明专利技术通过采集患者的临床特征和影像特征,经过LASSO特征选择和随机森林分类器建立模型,获得了一种能够准确、无创的预测肺癌患者的EGFR/TP53基因共突变情况的人工智能预测系统。实验结果表明,本发明专利技术建立的人工智能预测系统对肺癌患者的EGFR/TP53基因共突变情况的预测效果更优异,测试集的AUC值高达0.746。本发明专利技术的人工智能预测系统为临床上筛查肺癌患者中EGFR+/TP53+共突变的患者,以及筛查EGFR突变肺癌患者中对TKI耐药的患者提供了一种新的选择,对EGFR/TP53共突变肺癌患者的临床精准治疗具有重要的指导意义。床精准治疗具有重要的指导意义。床精准治疗具有重要的指导意义。

【技术实现步骤摘要】
一种无创预测EGFR/TP53共突变肺癌患者的人工智能系统


[0001]本专利技术属于肺癌预测系统领域,特别是涉及一种无创预测EGFR/TP53共突变肺癌患者的人工智能系统。

技术介绍

[0002]随着经济、科技的发展,叠加环境暴露、不健康的生活方式等,癌症的发生率在全球仍然较高,其中肺癌是最常见的癌症之一。根据国际癌症研究机构(International Agency for Research on Cancer,IARC)的GLOBOCAN(Global Cancer Observatory)数据,2020年全球有约1930万新发癌症病例和约1000万患者因癌症而死亡,其中肺癌的新发病例约占11.1%,死亡病例约占18.0%。
[0003]原发性肺癌根据病理特征分为非小细胞肺癌(non

small cell lung cancer,NSCLC)以及小细胞肺癌(small cell lung cancer,SCLC),其中NSCLC约85%,SCLC约15%。对于NSCLC的研究是肺癌管理中的重心。
[0004]传统的NSCLC化疗药物治疗效果有限,而目标区域高通量测序(TRS)技术的发展为不同基因突变的NSCLC患者实施精准治疗带来了曙光。研究发现,NSCLC的发生发展中有多个相关的基因突变位点,其中表皮生长因子受体(epidermal growth factor receptor,EGFR)基因是亚裔NSCLC患者中最常见的驱动基因之一。EGFR是原癌基因ErbB

1的表达产物。在正常生理情况下,EGFR可调节上皮组织和维持机体体内稳态。当EGFR基因有突变或损伤时,将驱动细胞异常生长,造成癌症的发生发展。目前针对EGFR酪氨酸激酶区域激活突变的相应靶向药物已广泛应用于肺癌治疗,针对不同EGFR突变位点包括19外显子缺失、21外显子p.L858R点突变和其它不典型突变,多种酪氨酸激酶抑制剂(tyrosine kinase inhibitor,TKI)已广泛运用于临床实践,改善了NSCLC患者的生存预后。
[0005]但是,临床对于EGFR突变的患者使用TKI治疗发现相同TNM分期的患者有不同的治疗效果,部分患者的疗效较差,更容易出现TKI耐药,针对这部分患者,如何早期识别并进一步干预是临床上面临的挑战。
[0006]TP53是癌症中最常见的易突变基因之一。Donehower等人分析了TCGA肿瘤基因组图谱数据库中来自32种癌症的10 225名患者的全外显子序列中的TP53突变情况,其中有3786名患者具有TP53突变,同时不同的癌症类型的TP53突变频率不相同,其中,对NSCLC患者的检测结果显示TP53是NSCLC的高频突变基因之一。已有多项研究发现,针对EGFR突变的患者使用TKI治疗后,若患者同时存在TP53基因突变,该类患者的预后较差,更易出现耐药。因此,快速准确的检测出EGFR/TP53共突变的NSCLC患者,对NSCLC的临床精准治疗具有重要的意义。

技术实现思路

[0007]针对上述问题,本专利技术的目的在于提供一种无创预测EGFR/TP53共突变肺癌患者的人工智能系统。
[0008]本专利技术提供了一种预测肺癌患者的基因突变情况的人工智能系统,所述人工智能系统包括以下五个部分:
[0009]第一部分:数据输入部分;输入肺癌患者的影像学特征和临床特征;
[0010]第二部分:特征选择部分;对第一部分输入的影像学特征和临床特征进行选择,得到选择后的特征;
[0011]第三部分:模型构建部分;将第二部分选择后的特征分为训练集数据和测试集数据,用训练集数据训练随机森林分类器构建预测模型;
[0012]第四部分:预测部分;利用第三部分构建的预测模型处理测试集数据,判断出肺癌患者的基因突变情况为EGFR/TP53共突变或非EGFR/TP53共突变。
[0013]进一步地,第一部分中,所述影像学特征是通过以下方法提取得到的:
[0014](1)将肺癌患者的平扫CT影像进行感兴趣区域分割,得到病灶的图像感兴趣区域;
[0015](2)将图像感兴趣区域分别经14类滤波器预处理,得到预处理后的图像;所述14类滤波器为:加性高斯噪声滤波器、二项式图像模糊滤波器、盒子均值滤波器、盒子西格玛图像滤波器、曲率流滤波器、离散高斯滤波器、拉普拉斯锐化滤波器、均值滤波器、归一滤波器、递归高斯滤波器、散粒噪声滤波器、斑点噪声滤波器、高斯拉普拉斯滤波器、小波滤波器;
[0016](3)分别对未经预处理的图像感兴趣区域、预处理后的图像进行影像学特征提取,得到7类影像学特征:一阶特征、形状特征、灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、灰度依赖矩阵、临近灰度差矩阵。
[0017]进一步地,第一部分中,所述临床特征为以下21维临床特征:性别;年龄,单位:岁;吸烟史;肺癌家族史;非肺癌家族史;日吸烟量,单位:支;吸烟年数;戒烟与否;戒烟年数;嗜酒与否;嗜酒时间,单位:年;嗜酒量,单位:克/天;咳嗽与否;胸痛与否;咯血与否;咳痰与否;癌胚抗原,单位ng/ml;癌抗原125,单位U/ml;糖类抗原199,单位U/ml;细胞角蛋白19片段,单位ng/ml;神经元特异性烯醇化酶,单位ng/ml。
[0018]进一步地,第二部分中,所述选择的方法为采用套索算法,设置alpha值为0.0152,选出影像学特征和临床特征中特征系数最高的前108维特征。
[0019]进一步地,第三部分中,所述随机森林分类器的参数设置为:类别权重使用Balance,指标选用Entroy,最大深度6,叶子节点最小样本数3,最小切分样本数2,弱分类器个数2000,分类阈值0.5。
[0020]进一步地,所述肺癌为非小细胞肺癌。
[0021]进一步地,所述非小细胞肺癌为EGFR突变的非小细胞肺癌。
[0022]进一步地,所述EGFR突变的非小细胞肺癌对酪氨酸激酶抑制剂耐药。
[0023]本专利技术还提供了一种预测肺癌患者的基因突变情况的设备,所述设备上存储有上述的人工智能系统。
[0024]本专利技术还提供了上述的人工智能系统在制备预测肺癌患者的基因突变情况的设备中的用途,所述设备能够预测出肺癌患者的基因突变情况为EGFR/TP53共突变或非EGFR/TP53共突变。
[0025]本专利技术中,EGFR/TP53共突变指EGFR基因突变合并TP53基因突变,表示为EGFR+/TP53+。
[0026]非EGFR/TP53共突变指除EGFR/TP53共突变以外的情况,包括EGFR+/TP53

、EGFR

/TP53+、EGFR

/TP53


[0027]其中,EGFR+/TP53

表示EGFR基因突变,TP53基因未突变;EGFR

/TP53+表示TP53基因突变,EG本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种预测肺癌患者的基因突变情况的人工智能系统,其特征在于:所述人工智能系统包括以下五个部分:第一部分:数据输入部分;输入肺癌患者的影像学特征和临床特征;第二部分:特征选择部分;对第一部分输入的影像学特征和临床特征进行选择,得到选择后的特征;第三部分:模型构建部分;将第二部分选择后的特征分为训练集数据和测试集数据,用训练集数据训练随机森林分类器构建预测模型;第四部分:预测部分;利用第三部分构建的预测模型处理测试集数据,判断出肺癌患者的基因突变情况为EGFR/TP53共突变或非EGFR/TP53共突变。2.根据权利要求1所述的人工智能系统,其特征在于:第一部分中,所述影像学特征是通过以下方法提取得到的:(1)将肺癌患者的平扫CT影像进行感兴趣区域分割,得到病灶的图像感兴趣区域;(2)将图像感兴趣区域分别经14类滤波器预处理,得到预处理后的图像;所述14类滤波器为:加性高斯噪声滤波器、二项式图像模糊滤波器、盒子均值滤波器、盒子西格玛图像滤波器、曲率流滤波器、离散高斯滤波器、拉普拉斯锐化滤波器、均值滤波器、归一滤波器、递归高斯滤波器、散粒噪声滤波器、斑点噪声滤波器、高斯拉普拉斯滤波器、小波滤波器;(3)分别对未经预处理的图像感兴趣区域、预处理后的图像进行影像学特征提取,得到7类影像学特征:一阶特征、形状特征、灰度共生矩阵、灰度游程矩阵、灰度区域大小矩阵、灰度依赖矩阵、临近灰度差矩阵。3.根据权利要求1所述的人工智能系统,其特征在于:第一部分中,所述临床特征为以下21维临床特征:性别;年龄,单位:岁;吸烟史;肺癌家族史;...

【专利技术属性】
技术研发人员:陈勃江李为民胥任杰周曜婕余何张瑞田攀文
申请(专利权)人:四川大学华西医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1