一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型制造技术

技术编号:37243070 阅读:12 留言:0更新日期:2023-04-20 23:23
本发明专利技术首次提供了一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型,该特征组合包含以下11个基因:RALGPS2、KIAA0907、SPATS2、FKBP11、LOC158376、HN1L、ALDH18A1、EMP2、C1orf106、SRPK1、C16orf88,与非小细胞肺癌(NSCLC)临床分期(stage)等12种特征构成了可准确预测非小细胞肺癌患者生存期及生存概率的组合。本发明专利技术开发的包含上述12种特征的生存预测模型,可通过输入12种特征参数,对患者的生存概率进行准确预测,预测准确率可达92.84%。率可达92.84%。率可达92.84%。

【技术实现步骤摘要】
一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型


[0001]本专利技术属于生物
,具体涉及一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型。

技术介绍

[0002]2015年美国癌症协会(American Cancer Society,ACS)发布的数据显示,肺癌的发病率和死亡率在所有恶性肿瘤中排名首位,严重危害了人类的生命健康。常见的肺癌类型有非小细胞肺癌和小细胞肺癌,以非小细胞肺癌多见,约占全部肺癌的80%,其中,鳞癌和腺癌是非小细胞肺癌最常见的病理类型。因为肺癌发病早期症状不典型,未能引起足够的重视,大部分患者在发现时已是局部晚期或有远处转移,失去了治疗的最佳时机,生存率较低。近年来,随着科学技术的日益发展和医疗水平的不断进步,更多的新疗法广泛用于肿瘤的治疗,包括分子靶向治疗、细胞免疫治疗等,并取得较好的治疗效果,大部分恶性肿瘤的生存率都有不同程度的提高,但肺癌的生存率提高不明显,总体5年生存率为16%,仅高于胰腺癌。国内外的学者一直致力于研究肿瘤的发生发展、防治及预后等各个方面的关系,以期提高肿瘤早期的诊断率,给予及时有效的治疗,提高患者的生活质量,延长患者的生存时间。
[0003]肺癌患者在治疗的过程中,通常会通过CT影像检查来判断药物疗效以及观察疾病是否进展,但是在检查的过程中会对身体产生辐射,对患者产生一定的伤害。非小细胞肺癌患者的高死亡率又体现了为非小细胞肺癌患者确定可靠预后信号的必要性。因此,为了对非小细胞肺癌患者预后的生存信号进行预测,开发新的检测试剂与诊断装置有着较大的应用价值,将给后期的治疗带来更多的便利。本专利技术首次公开了一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型,通过向模型中输入筛选出的基因转录本组合的表达情况以及非小细胞肺癌患者的临床分期,可以准确预测该患者的生存曲线,进而得到其3年、5年、10年等时间点的生存率。

技术实现思路

[0004]为了填补现有技术的空白,本专利技术的目的在于提供一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型。
[0005]本专利技术解决上述技术问题的技术方案如下:
[0006]本专利技术的第一方面提供了一种预测非小细胞肺癌患者生存率的特征组合,包括如下11种基因的转录本:RALGPS2、KIAA0907、SPATS2、FKBP11、LOC158376、HN1L、ALDH18A1、EMP2、C1orf106、SRPK1及C16orf88;
[0007]进一步的,还包括非小细胞肺癌的临床分期,即stage;
[0008]进一步的,预测样本为非小细胞肺癌组织RNA。
[0009]本专利技术的第二方面提供了一种预测非小细胞肺癌患者生存率的Cox比例风险模
型,由上述特征组合共同拟合而成;
[0010]进一步的,所述风险模型中各特征的权重系数如下所示:
[0011]特征名权重系数stage0.34RALGPS2

0.26KIAA09070.21SPATS2

0.14FKBP110.18LOC158376

0.25HN1L

0.17ALDH18A10.09EMP20.14C1orf106

0.08SRPK10.17C16orf88

0.10
[0012]进一步的,所述风险模型的使用包括如下步骤:
[0013](1)获取非小细胞肺癌组织,提取总RNA,进行逆转录,逆转录为cDNA;
[0014](2)进行文库构建;
[0015](3)测序上机,获得各转录本的reads数;
[0016](4)进行下机数据质控、数据过滤后,得到每个转录本的count数;
[0017](5)在风险模型中,根据患者的临床情况,输入数字1、2、3、4,分别对应临床I期、II期、III期、IV期;所述的11种基因转录本,需要根据各基因的阈值,进行二值化处理,当该转录本的count数小于阈值时,输入值为数字0,反之则为数字1;
[0018]进一步的,所述各基因的阈值如下所示:
[0019][0020][0021]进一步的,通过所述的风险模型计算得到患者的生存曲线,进一步得到患者的生存率;
[0022]其中,患者的生存率可以是3年、5年、10年等时间点;
[0023]其中,各基因转录本分析时,参考基因组版本为hg19版。
[0024]本专利技术的第三方面提供了一种上述Cox比例风险模型的构建方法,包括如下步骤:
[0025](1)总体特征的纳入:在前期筛选出的用于肺癌诊断的基因转录本组合的基础上,纳入临床分期(stage)等特征,进行Cox比例风险建模及特征筛选;
[0026]具体的,本专利技术中在纳入38个基因转录本(见本申请人前期申请的专利“一种用于肺癌诊断的基因转录本组合及肺癌诊断装置”,申请号为202211336839)的基础上,又整合了年龄(age)、性别(gender)、组织分型(type)、临床分期(stage)等一般临床特征,共计纳入了42个特征,进入后续的Cox比例风险建模及特征筛选中;
[0027](2)样本筛选:进行数据清洗,最终确定纳入分析的总样本;
[0028]具体的,本专利技术中剔除了含缺失值、意义不明值等的样本,最终纳入分析的总样本数为989例;
[0029](3)特征选择:使用AIC向前逐步回归法进行特征筛选,确定特征组合;
[0030]具体的,AIC即赤池值,是衡量模型拟合优良性和模型复杂性的一种标准,在建立多元线性回归模型时,变量过多,且有不显著的变量时,可以使用AIC准则结合逐步回归进行变量筛选。AIC越小我们认为模型更优良。特征选择完成后,共计纳入12个特征,包含11种基因转录本特征和stage特征;
[0031](4)模型参数选择及优化:将全部样本随机拆分为训练集和测试集,使用训练集样本进行模型的训练,使用测试集样本验证模型的准确度。通过循环参数调整并绘制生存预测校准曲线,得到最佳的模型参数;
[0032]具体的,本专利技术中的样本按7:3的比例拆分,得到的最佳模型参数为“penalizer=0.05,l1_ratio=0.15”;
[0033](5)模型准确率的计算:优化Cox比例风险模型后,分别带入训练集、测试集样本,进行模型准确度评估;
[0034]进一步的,所述模型准确度不低于92%;
[0035]具体的,本专利技术中训练集得分为0.6559,测试集得分为0.6094,模型准确率为92.84%。
[0036]本专利技术的有益效果在于:
[0037]本专利技术首次提供了一种预测非小细胞肺癌患者生存率的特征组合及Cox比例风险模型。该模型可预测非小细胞肺癌患者的生存率,准确率可达92.84%,对于有效研究非小细胞肺癌的发生发展、防治及预后等各个方面具有重要意义。
附图说明...

【技术保护点】

【技术特征摘要】
1.一种预测非小细胞肺癌患者生存率的特征组合,其特征在于,包括如下11种基因的转录本:RALGPS2、KIAA0907、SPATS2、FKBP11、LOC158376、HN1L、ALDH18A1、EMP2、C1orf106、SRPK1及C16orf88。2.根据权利要求1所述的预测非小细胞肺癌患者生存率的特征组合,其特征在于,还包括非小细胞肺癌的临床分期,即stage。3.根据权利要求1或2任一项所述的预测非小细胞肺癌患者生存率的特征组合,其特征在于,预测样本为非小细胞肺癌组织RNA。4.一种预测非小细胞肺癌患者生存率的Cox比例风险模型,其特征在于,由权利要求2所述的特征组合共同拟合而成。5.根据权利要求4所述的预测非小细胞肺癌患者生存率的Cox比例风险模型,其特征在于,所述风险模型中各特征的权重系数如下所示:特征名权重系数stage0.34RALGPS2

0.26KIAA09070.21SPATS2

0.14FKBP110.18LOC158376

0.25HN1L

0.17ALDH18A10.09EMP20.14C1orf106

0.08SRPK10.17C16orf88

0.106.根据权利要求5所述的预测非小细胞肺癌患者生存率的Cox比例风险模型,其特征在于,所述风险模型的使用包括如下步骤:(1)获取非小细胞肺癌组织,提取总RNA,进行逆转录,逆转录为cDNA;(2)进行文库构建;(3)测序上机,获得各转录本的reads数;(4)进行下机数据质控、数据过滤后,得到每个转录本的count数;(5)在风险模型中,根据患者的临床情况,输入数字1、2、3、4,分别对...

【专利技术属性】
技术研发人员:李万帅汤丽丽文诗语
申请(专利权)人:常州国药医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1