一种基于内质网应激特征基因的胃癌预后风险模型和应用制造技术

技术编号:36036792 阅读:49 留言:0更新日期:2022-12-21 10:40
本发明专利技术属于肿瘤标志物和生物医学检测技术领域,具体涉及一种基于内质网应激特征基因的胃癌预后风险模型和应用。将从TCGA数据库中收集到的数据作为训练集,共纳入了375例胃癌样本和32例癌旁样本。并使用GEO数据库中387例胃癌样本作为外部验证集进行验证。根据综合挖掘转录谱和肿瘤微环境特征成功筛选出的6个内质网应激特征基因NOS3、PON1、CXCR4、MATN3、ANXA5、SERPINE1。该预测模型在训练集及测试集中都展现出了预测胃癌总体生存率良好的性能。基于6个内质网应激相关基因的风险评分可以很好地将胃癌患者分为高风险、低风险人群,这可能有助于临床治疗方案的选择。能有助于临床治疗方案的选择。能有助于临床治疗方案的选择。

【技术实现步骤摘要】
一种基于内质网应激特征基因的胃癌预后风险模型和应用


[0001]本专利技术属于肿瘤标志物和生物医学检测
,具体涉及一种基于内质网应激特征基因的胃癌预后风险模型和应用。

技术介绍

[0002]胃癌是全球第三大癌症死亡原因和第五大常见恶性肿瘤,每年约有超过100万例新病例。中国是胃癌高发国家,新增病例和死亡病例分别占全球总数的42.6%和45.0%,年龄标准化5年生存率为27.4%。胃癌样本早期症状隐匿,治疗效果及预后差。多数胃癌样本确诊时已是晚期,导致总体预后不佳,表现为转移、高肿瘤内异质性和化学耐药性。尽管免疫治疗、靶向治疗和转化治疗在胃癌治疗方面迅速发展,但大多数样本的总生存率仍较低。
[0003]在肿瘤发生发展过程中,肿瘤细胞的高代谢和快速增殖导致肿瘤内部缺血缺氧,使肿瘤细胞进入持续的内质网应激状态。研究表明特定强度的内质网应激可以通过多种机制影响癌症的发生发展,包括促进癌细胞生长和转移、血管生成、免疫逃逸和放化疗耐药性。内质网应激尤其对胃癌的发生、进展和治疗具有重要影响,其可通过与幽门螺杆菌、EB病毒相互作用促进胃癌的进展,还可通过促进胃癌细胞的上皮间质转化导致胃癌细胞迁移和侵袭。
[0004]生物标志物可以有效的预测癌症样本的预后。近年来,许多研究将基因作为肿瘤发展和预后的生物标志物。目前,组织学诊断和肿瘤

淋巴结

转移(TNM)分期仍是评价胃癌预后的主要方法。由于胃癌的高度异质性和样本的个体差异,即使具有相似的临床和病理特征甚至相同的TNM分期的样本,其预后和治疗效果也具有很大差异。这表明以往的胃癌预后评价指标可能已经扩展到预测样本预后结局和治疗益处的极限。因此,急需鉴定新的生物标志物以辅助完善目前的预后指标,为胃癌的预后评价及个体化治疗提供依据。

技术实现思路

[0005]针对胃癌的高度异质性和样本的个体差异缺少准确的预后指标的问题,本专利技术提供了一种内质网应激的胃癌风险预后评分模型及构建方法和应用。
[0006]为了达到上述目的,本专利技术采用了下列技术方案:
[0007]一种基于内质网应激特征基因的胃癌预后风险模型,内质网应激基因为:NOS3、PON1、CXCR4、MATN3、ANXA5、SERPINE1;
[0008]风险评分模型=(0.052
×
NOS3表达水平)+(0.137
×
PON1表达水平)+(0.067
×
CXCR4表达水平)+(0.131
×
MATN3表达水平)+(0.116
×
ANXA5表达水平)+(0.09
×
SERPINE1表达水平)。
[0009]一种基于内质网应激特征基因的胃癌预后风险模型的构建方法,包括以下步骤:
[0010]步骤1,从癌症基因组图谱TCGA(http://cancergemome.nih.gov/)中获取RNA sequence数据集和临床数据,作为训练集;从GEO数据库中(http://www.ncbi.nlm.nih.gov/geo/)获取胃癌样本作为验证集;
[0011]为了保证数据的可比性,对RNA

seqs数据进行每百万转录本(TPM)转化,并通过log2(TPM+1)转化进行数据归一化以便后续分析;
[0012]步骤2,从GeneCards数据库(https://www.genecards.org/)中获取内质网应激相关特征基因ERS

RGs;使用R软件中的“limma”包进行胃癌组织与癌旁组织之间的差异表达分析,为了纳入更全面的胃癌差异基因,根据P<0.05和|log2(Fold Change)|>0作为筛选标准;利用R软件中的“survival”包进行单因素Cox回归分析,筛选出具有预后价值的内质网应激特征相关的胃癌差异表达基因;
[0013]步骤4,通过使用“glmnet”R程序包进行最小绝对收缩算子(least absolute shrinkage and selection operator,LASSO)回归分析于训练集中构建多基因风险模型;
[0014]筛选出构建风险评分模型的基因包括:NOS3、PON1、CXCR4、MATN3、ANXA5、SERPINE1;
[0015]构建出风险评分模型:
[0016]风险评分模型=(0.052
×
NOS3表达水平)+(0.137
×
PON1表达水平)+(0.067
×
CXCR4表达水平)+(0.131
×
MATN3表达水平)+(0.116
×
ANXA5表达水平)+(0.09
×
SERPINE1表达水平);
[0017]步骤4,通过模型构建基因相应的回归系数,计算每位样本的风险评分通过样本风险评分中位数将胃癌样本分为高

低风险两组;使用GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)中的数据(N=387)作为验证集;将成功构建的风险评分模型应用于验证集中进行验证;
[0018]利用“survminer”程序包对鉴定出的高低风险组进行Kaplan

Meier(K

M)曲线分析,比较两组样本总生存期(OS)差异;使用“timeROC”程序包绘制时间依赖的受试者工作特征曲线(receiver operating characteristic curve,ROC),计算胃癌样本在多个时间点的曲线下面积(Area under the curve,AUC),以评估风险模型预测胃癌样本预后的能力;在验证集中使用相同风险评分公式和临界值验证模型的准确性。
[0019]根据上述一种基于内质网应激特征基因的胃癌预后风险模型在制备试剂盒中的应用。
[0020]根据上述试剂盒在胃癌患者总体生存率预测产品中的应用。
[0021]根据上述试剂盒在胃癌患者总体生存率诊断产品中的应用。
[0022]根据上述试剂盒在胃癌患者总体生存率辅助诊断产品中的应用。
[0023]本专利技术使用内质网应激相关特征基因开发了一种实用性强的胃癌预后风险模型,以预测胃癌患者的总体生存期。本专利技术分析了来自TCGA数据库和GEO数据库中胃癌患者的基因表达谱。将从TCGA数据库中收集到的数据作为训练集,共纳入了375例胃癌样本和32例癌旁样本。并使用GEO数据库中387例胃癌样本进行验证。通过R软件包“limma”筛选出TCGA数据库中胃癌组织和癌旁的差异表达基因(DEG)。通过GeneCards数据库,确定出DEG中的ER应激相关基因。基于训练集中DEG数据,我们使用单变量Cox回归分析以及LASSO回归分析建立出具有6个内质网应激相关特征基因的预后模型,并将胃癌患者分为高、低风险组。通过结合临床特征和风险评本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于内质网应激特征基因的胃癌预后风险模型,其特征在于:内质网应激基因为:NOS3、PON1、CXCR4、MATN3、ANXA5、SERPINE1;风险评分模型=(0.052
×
NOS3表达水平)+(0.137
×
PON1表达水平)+(0.067
×
CXCR4表达水平)+(0.131
×
MATN3表达水平)+(0.116...

【专利技术属性】
技术研发人员:张一凡陈星乔军王琪张荷艺张升校郝铭慧隋玥卢俊会乔瑶任洁颖
申请(专利权)人:山西医科大学第一医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1