一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法技术

技术编号:21304011 阅读:78 留言:0更新日期:2019-06-12 09:09
本发明专利技术涉及基因技术及生物医学领域,具体涉及一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法。一种预测肺鳞癌预后的模型,含有主要与肺鳞癌的预后有关的7个基因为:CSRNP1、CLEC18B、MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42,其中CSRNP1和CLEC18B的表达与存活率呈正相关,而MIR27A、AC130456.4,DEFA6,ARL14EPL和ZFP42的表达与存活率呈负相关。本发明专利技术提供多个基因作为生物标记物,提高了对于预测肺鳞状细胞癌的预后灵敏度和准确性,从而降低肺鳞癌患者的死亡率、局部复发率,并通过风险预测模型改善患者的预后。

A Model and Establishment Method for Predicting Prognosis of Lung Squamous Cell Carcinoma with Seven Genes as Biomarkers

The invention relates to the field of gene technology and biomedicine, in particular to a model containing seven genes as biomarkers for predicting the prognosis of lung squamous cell carcinoma and its establishment method. A model for predicting the prognosis of lung squamous cell carcinoma contains seven genes that are mainly related to the prognosis of lung squamous cell carcinoma: CSRNP1, CLEC18B, MIR27A, AC130456.4, DEFA6, ARL14EPL and ZFP42. The expressions of CSRNP1 and CLEC18B are positively correlated with survival rate, while the expressions of MIR27A, AC130456.4, DEFA6, ARL14EPL and ZFP42 are negatively correlated with survival rate. The invention provides multiple genes as biomarkers, improves the sensitivity and accuracy of predicting the prognosis of lung squamous cell carcinoma, reduces the mortality and local recurrence rate of lung squamous cell carcinoma patients, and improves the prognosis of patients through risk prediction model.

【技术实现步骤摘要】
一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法
本专利技术属于基因技术及生物医学领域,具体涉及一种含有七个基因作为生物标志物预测肺鳞癌预后的模型及建立方法。
技术介绍
肺鳞癌即肺鳞状细胞癌,是最主要的肺癌病理类型之一,其来源于支气管上皮细胞恶变,病例数占非小细胞肺癌的30%左右。肺鳞癌的常规治疗方法主要包括手术治疗、化学治疗和分子靶向治疗,患者的5年生存率低于15%,全世界每年约40余万人因其致死。目前,对肺鳞癌患者的预后判定没有参考标准,也没有特异性的指标,远远不能适应对肺鳞癌患者进行预后判定的需求。因此,对肺鳞癌患者预后进行判定,以便选择最佳治疗方案,显著提高患者生存率,成为胸外科领域亟待解决的重要课题。因此,需要及时研究肺鳞癌治疗后的预后。现有技术对预测肺鳞癌预后的有效基因知之甚少。此外,许多已经公开的研究只集中在单基因上来预测肺鳞癌的预后。例如,Podoplanin的强烈表达可能提示与癌细胞的侵袭或迁移相关的更好的总体存活。此外,FAM83B也被发现作为预示良好预后的生物标志物,而潜在的机制仍需要澄清。虽然p114RhoGEF的过表达可能成为反映其预测淋巴结转移的作用导致的总体生存率低的标志,而GASC1和5-microRNA表明预后不良。然而,作为生物标志物的单个基因对于预测肺鳞状细胞癌的预后不够灵敏和准确。目前,作为生物标志物的多个基因对于预测肺鳞状细胞癌的预后判定没有参考标准,也没有特异性的指标,远远不能适应对肺鳞癌患者进行预后判定的需求。因此,寻找作为生物标志物的多个基因对于预测肺鳞状细胞癌的预后判定,以便选择最佳治疗方案,显著提高患者生存率,成为胸外科领域亟待解决的重要课题。
技术实现思路
鉴于现有技术存在的问题,本专利技术的目的在于提供一种含有七个基因作为生物标志物预测肺鳞癌预后的模型。本专利技术提供多个基因作为生物标记物,提高了对于预测肺鳞状细胞癌的预后灵敏度和准确性,从而降低肺鳞癌患者的死亡率、局部复发率,并通过风险预测模型改善患者的预后。为了实现上述目的,本专利技术采用以下技术方案。一种预测肺鳞癌预后的模型,含有主要与肺鳞癌的预后有关的7个基因为:CSRNP1、CLEC18B、MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42,其中CSRNP1和CLEC18B的表达与存活率呈正相关,而MIR27A、AC130456.4,DEFA6,ARL14EPL和ZFP42的表达与存活率呈负相关。一种含有七个基因作为生物标志物预测肺鳞癌预后的模型的建立方法,具体包括以下步骤。1.数据采集。从癌症基因组图谱(TCGA)数据库(http://cancergenome.nih.gov/)总共获得551个样品,包括49个正常样品和502个肺鳞状癌样品。同时所有样品包含来自数据库的关于年龄、性别、种族、吸烟状况、癌症阶段、存活时间和RNA表达谱的相应临床数据。通过符合选择标准的R(http://www.r-project.org)筛选出差异表达的基因如下:1)p<0.05;2)|log2fold更改|>1。2.Cox回归模型的构建。通过收集不同表达的基因,随机选择363个样本作为训练集,188个样本作为基于R的测验集;使用Cox单变量分析来获得预后相关基因。通过逐步回归进行Cox多变量分析,以最终确定具有可预测变量的模型;风险评分分期模型是通过R包“生存”函数coxph()开发的。公式如下:(i表示可预测基因的数量;β表示基因系数;X表示相应基因的相对表达值)。系数β>0的基因与存活时间呈负相关,可能是危险因素,系数β<0的基因被定义为保护基因。样本按风险评分进行分类,高风险组的风险评分超过风险评分的中位数,低风险组的风险评分较低。并且通过Kaplan-Meier曲线进行高风险组和低风险组之间的存活率比较,并通过R包“生存”通过对数秩检验进行分析。进行关于随访时间和风险评分之间关系的另一个图。通过R包“pROC”进一步使用接受者操作特征(ROC)分析来评估该模型是否是预测预后的最佳模型。3.在测验集和所有样本上验证模型。为进一步验证该模型是否普遍适用于临床使用,在检查组和所有样本中进行了测试。根据测验集和所有样本中先前的风险评分,将样本分为高风险组和低风险组。使用Kaplan-Meier曲线和对数秩检验来比较两组之间存活率的差异。4.风险评分与其他因素的关系分析。确定风险评分与预后显着相关。然后比较了不同分数的临床信息之间的差异。此外,Cox回归模型用于调查风险评分与其他临床信息之间的关系,包括年龄,性别,种族,吸烟状况和癌症阶段。利用树图来找出存活率与临床因素之间的关系以及风险评分,同时进行相关图以直接找到关联。5.基因集富集分析。通过GSEA(http://software.broadinstitute.org/gsea/index.jsp)评估了高风险组和低风险组之间显着改变的信号通路,基因集富集分析通过Java软件GSEA进行。6.统计分析。使用R软件包(http://www.r-project.org)进行统计分析。所有分析均在R版本3.3.2中进行,使用以下软件包:“glmnet”、“lpc”、“CoxBoost”、“limma”和“ROCR”。与现有技术相比,本专利技术具有以下有益效果。本专利技术主要强调收集生物标志物来评估肺鳞癌患者的预后,通过COX单变量分析获得训练集中预后相关基因,然后进行逐步Cox多变量分析,最终确定模型。根据风险评分的中位数将样本分为高风险组和低风险组。区别于现有技术的,本专利技术基于多变量分析,并且对每个基因的功能进行了阐述和验证。本专利技术提出一种含有七个基因作为生物标志物预测肺鳞癌预后的模型来预测肺鳞癌患者的预后。并且在实施例中进一步验证了该模型的可行性,此外该模型中的基因主要与DNA损伤刺激,DNA修复和DNA复制相关。本专利技术为分析肺鳞癌和癌症相关基因患者的预后提供了可靠的方法。附图说明图1为训练集中7基因模型的表现,其中(A)Kaplan-Meier生存曲线显示高风险组和低风险组之间关于生存率的差异;(B)ROC曲线显示模型的可靠性;(C)风险评分的分布,随访时间的生存状态和训练组中7种基因的表达谱。图2为测验集中7基因模型的表现,其中(A)Kaplan-Meier生存曲线说明了高风险组和低风险组之间关于生存率的差异;(B)样本的风险评分分布,随访时间的存活状态和检查组中7种基因的表达谱。图3为所有样品中7基因模型的性能,其中(A)Kaplan-Meier生存曲线说明了所有样本中高风险组和低风险组之间存活率的差异;(B)样品的风险评分分布,随访时间的存活状态和样品中7种基因的表达谱。图4为所有样本中临床因素和风险评分的临床意义(临床因素和风险评分的临床重要性.CI,置信区间;HR,风险比)。图5为所有样本中风险评分与临床因素之间的关联。图6为GSEA关于高风险和低风险组之间不同表达基因的结果,(A)DNA损伤刺激;(B)DNA修复;(C)DNA复制。GSEA,基因集富集分析。具体实施方式下面结合附图和实施例详细描述本专利技术,以下所述仅是本专利技术的优选实施方式,应当指出,对于本
的普通技术人员,在不脱离本专利技术本文档来自技高网
...

【技术保护点】
1.一种预测肺鳞癌预后的模型,其特征在于,含有主要与肺鳞癌的预后有关的7个基因为:CSRNP1、CLEC18B、MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42,其中CSRNP1和CLEC18B的表达与存活率呈正相关,而MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42的表达与存活率呈负相关。

【技术特征摘要】
1.一种预测肺鳞癌预后的模型,其特征在于,含有主要与肺鳞癌的预后有关的7个基因为:CSRNP1、CLEC18B、MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42,其中CSRNP1和CLEC18B的表达与存活率呈正相关,而MIR27A、AC130456.4、DEFA6、ARL14EPL和ZFP42的表达与存活率呈负相关。2.一种含有七个基因作为生物标志物预测肺鳞癌预后的模型的建立方法,具体包括以下步骤:1)数据采集从癌症基因组图谱数据库总共获得551个样品,包括49个正常样品和502个肺鳞状癌样品,同时所有样品包含来自数据库的关于年龄、性别、种族、吸烟状况、癌症阶段、存活时间和RNA表达谱的相应临床数据,通过符合选择标准的R筛选出差异表达的基因如下:p<0.05;|log2fold更改|>1;2)Cox回归模型的构建通过收集不同表达的基因,随机选择363个样本作为训练集,188个样本作为基于R的测验集,使用Cox单变量分析来获得预后相关基因;通过逐步回归进行Cox多变量分析,以最终确定具有可预测变量的模型;风险评分分期模型是通过R包“生存”函数coxph()开发的,公式如下:其中i表示可预测基因的数量,β表示基因系数,X表示相应基因的相对表达值,系数β>0的基因与存活时间呈负相关,可能是危险因素,系数β<0的基因...

【专利技术属性】
技术研发人员:于韬李强赵丹王哲王浩天朱家伟
申请(专利权)人:辽宁省肿瘤医院
类型:发明
国别省市:辽宁,21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1