用于结直肠癌预后风险预测的生物标志物、模型及其应用制造技术

技术编号:37409928 阅读:10 留言:0更新日期:2023-04-30 09:35
本发明专利技术涉及一种结直肠癌预后风险预测模型,模型通过以下步骤构建:获取结直肠癌患者的基因表达谱和临床信息数据,用于模型构建与验证的数据包括训练集和验证集;将基因表达矩阵进行差异表达分析得到差异表达基因;将差异表达基因在训练集中进行单因素Cox回归分析,筛选出预后相关基因;对筛选的基因进行LASSO Cox回归分析,通过交叉验证确定最优的λ值,筛选出组成模型的基因,根据基因的回归系数和其在训练集和验证集中的表达水平计算各患者的风险评分;根据风险评分将患者分为高、低风险组,通过KM生存曲线和时间依赖性ROC曲线等评估预测模型的预测性能。本发明专利技术能够为预测结直肠癌患者的生存时间和对化疗药物的敏感性带来新的策略。来新的策略。来新的策略。

【技术实现步骤摘要】
用于结直肠癌预后风险预测的生物标志物、模型及其应用


[0001]本专利技术涉及生物医药
,尤其是指一种用于结直肠癌预后风险预测的生物标志物、模型及其应用。

技术介绍

[0002]结直肠癌是目前最常见且预后最差的胃肠道恶性肿瘤之一,其占每年癌症相关死亡人数的10%。预计到2030年,将有超过220万的新发结直肠癌病例,且在青年人中结直肠癌发病率将增加90%。结直肠癌患者在早期通常会伴随排便习惯改变、便血、消瘦等,但缺乏非常明显的临床症状。因此,结直肠癌患者进行诊断治疗时往往处于晚期。研究表明,结直肠癌具有易复发和易转移的特点,且结直肠癌细胞具有较强的增殖能力。随着研究的深入,虽然早期诊断的结直肠癌患者5年生存率达90%以上,但转移性结直肠癌患者的5年生存率十分低,仅为12%。
[0003]目前,虽然手术切除、化疗、放疗、靶向治疗等常规治疗降低了结直肠癌患者的死亡率,但转移仍是大多数结直肠癌患者死亡的主要原因。此外,由于个体的异质性,不同患者的临床结果差异很大,这限制了传统治疗方法的有效性。随着多元组学技术的迅速发展,基于基因表达的预后模型已经成为筛查具有不同临床病理风险癌症患者的重要生物标志物。因此,开发新的多基因风险预测模型可为高危结直肠癌患者的识别提供有价值的信息,从而帮助临床医生监测疾病进展并设计合适的个性化治疗干预措施。

技术实现思路

[0004]为此,本专利技术所要解决的技术问题在于克服现有技术中存在的问题,提出一种用于结直肠癌预后风险预测的生物标志物、模型及其应用,其能够为预测结直肠癌患者的生存时间和对化疗药物的敏感性带来新的策略,帮助临床医生监测疾病进展并设计合适的个性化治疗干预措施。
[0005]为解决上述技术问题,本专利技术提供了一种结直肠癌预后风险预测模型,该预后风险预测模型通过以下步骤构建:
[0006]S1:从GEO和TCGA数据库获取结直肠癌患者的表达谱数据和临床信息数据,这两种数据用于预后风险预测模型的构建与验证,数据包括训练集和验证集,同时从GEO数据库获取癌症组织样本和正常对照组织样本的表达谱数据;
[0007]S2:将癌症组织样本和正常对照组织样本标准化后的基因表达矩阵进行差异表达分析,得到差异表达基因;
[0008]S3:将差异表达基因在训练集中进行单因素Cox回归和PH检验分析,筛选出预后相关基因;
[0009]S4:对筛选得到的基因进行LASSO Cox回归分析,通过交叉验证确定最优的λ值,筛选出组成预后风险预测模型的基因,并根据筛选出来的每个基因的回归系数和其在训练集和验证集中的标准化后的表达水平计算每个数据集中各患者的风险评分;
[0010]S5:根据所述风险评分评估所述预后风险预测模型的预测性能。
[0011]在本专利技术的一个实施例中,在S3中,将差异表达基因在训练集中进行单因素Cox回归和PH检验分析,筛选出预后相关基因的方法包括:
[0012]删除训练集预后信息中缺失总体生存时间和生存结局的样本;
[0013]在单因素Cox回归分析中,将差异表达基因在训练集中标准化的基因表达矩阵、样本的总体生存时间和生存结局信息作为输入文件进行单因素Cox回归分析,筛选出满足PH回归假设且p值小于设定值的与样本预后时间显著相关的基因。
[0014]在本专利技术的一个实施例中,在S4中,所述基因包括INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2。
[0015]在本专利技术的一个实施例中,所述基因INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2对应的回归系数分别为0.008048177、

0.014590776、0.169851027、

0.141714084、0.080175473、0.286836794、

0.115094672、0.070682084、0.044238906、

0.16681854、

0.071504884、0.281751541和0.070570821。
[0016]在本专利技术的一个实施例中,在S4中,所述风险评分的计算公式为:
[0017][0018]其中,Coef表示模型中每个基因的回归系数,E表示模型中每个基因标准化后的表达水平,i表示模型中基因的索引,n表示模型中包含的基因数量。
[0019]在本专利技术的一个实施例中,在S5中,根据所述风险评分评估所述预后风险预测模型的预测性能的方法包括:
[0020]以验证集和训练集的风险评分和临床指标作为变量进行多因素Cox回归分析,判断基于预后风险预测模型的风险评分是否能够作为结直肠癌的独立预后因子,同时根据风险评分进行KM生存曲线、时间依赖性的ROC曲线分析,评估该预后风险预测模型对结直肠癌患者总体生存时间的预测性能。
[0021]在本专利技术的一个实施例中,根据风险评分进行KM生存曲线、时间依赖性的ROC曲线分析,评估该预后风险预测模型对结直肠癌患者总体生存时间的预测性能的方法包括:
[0022]根据风险评分对样本进行升序或降序排列,确定样本的中位数,将风险评分大于中位数的样本作为高风险组,将风险评分小于中位数的样本作为低风险组;
[0023]以训练集和验证集的样本预后信息创建生存对象并拟合生存曲线,绘制可视化的KM生存曲线,采用log

rank统计检验分析结直肠癌患者高风险组和低风险组之间总体生存概率的差异性;
[0024]选取训练集和验证集的样本信息及预后信息中多个年度的生存率进行时间依赖的ROC分析并绘制曲线,计算曲线下的面积值及其置信区间,依据面积值评估该预后风险预测模型对结直肠癌患者总体生存时间的预测性能。
[0025]此外,本专利技术还提供一种用于结直肠癌预后风险预测的生物标志物,所述生物标志物包括基因INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2,其用于构建一种如上述所述的结直肠癌预后风险预测模型。
[0026]并且,本专利技术还提供一种如上述所述的结直肠癌预后风险预测模型在基因本体论
分析、免疫相关性分析以及化疗药物反应分析方面的应用。
[0027]本专利技术的上述技术方案相比现有技术具有以下优点:
[0028]本专利技术所述的一种用于结直肠癌预后风险预测的生物标志物、模型及其应用,其基于数学建模和生物信息学方法构建结直肠癌预后风险预测模型,能够有效识别具有预后价值的基因,从而能够为预测结直肠癌患者的生存时间和对化疗药物的敏感性带来新的策略,帮助临床医生监测疾病进展并设计合适的个性化治疗干本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种结直肠癌预后风险预测模型,其特征在于:该预后风险预测模型通过以下步骤构建:S1:从GEO和TCGA数据库获取结直肠癌患者的表达谱数据和临床信息数据,这两种数据用于预后风险预测模型的构建与验证,数据包括训练集和验证集,同时从GEO数据库获取癌症组织样本和正常对照组织样本的表达谱数据;S2:将癌症组织样本和正常对照组织样本标准化后的基因表达矩阵进行差异表达分析,得到差异表达基因;S3:将差异表达基因在训练集中进行单因素Cox回归和PH检验分析,筛选出预后相关基因;S4:对筛选得到的基因进行LASSOCox回归分析,通过交叉验证确定最优的λ值,筛选出组成预后风险预测模型的基因,并根据筛选出来的每个基因的回归系数和其在训练集和验证集中的标准化后的表达水平计算每个数据集中各患者的风险评分;S5:根据所述风险评分评估所述预后风险预测模型的预测性能。2.根据权利要求1所述的一种结直肠癌预后风险预测模型,其特征在于:在S3中,将差异表达基因在训练集中进行单因素Cox回归和PH检验分析,筛选出预后相关基因的方法包括:删除训练集预后信息中缺失总体生存时间和生存结局的样本;在单因素Cox回归分析中,将差异表达基因在训练集中标准化的基因表达矩阵、样本的总体生存时间和生存结局信息作为输入文件进行单因素Cox回归分析,筛选出满足PH回归假设且p值小于设定值的与样本预后时间显著相关的基因。3.根据权利要求1所述的一种结直肠癌预后风险预测模型,其特征在于:在S4中,所述预后风险预测模型所含的基因包括INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2。4.根据权利要求3所述的一种结直肠癌预后风险预测模型,其特征在于:所述基因INHBA、GALNT6、ZNF239、PDE6A、PTPRR、HSD17B2、CD177、CDKN2B、MALL、LGALS2、BTNL8、SCG2和PCOLCE2对应的回归系数分别为0.008048177、

0.014590776、0.169851027、

0.141714084、0.080175473、0.286836794、

0.115094672、0.070682084、0.044238906、

【专利技术属性】
技术研发人员:齐鑫赵园春闫东辉左嘉晨张元辰
申请(专利权)人:苏州科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1