Including the construction method, the expression of a classifier to predict lung cancer patient prognosis gene: training phase and data validation phase, the training stage includes first and second stages, the first stage of the use of supervised machine learning method to predict lung cancer patients after pre established gene expression classifier prototype, the method of second stage further the use of machine learning for predicting lung cancer prognosis gene expression classifier. The present method uses supervised machine learning method to obtain a gene expression classifier, which can accurately predict the prognosis of patients with non-small cell lung cancer. The gene expression classifier has very strong clinical transformation value. The gene group (panel) detection of gene expression, gene risk high risk score of non-small cell lung cancer patients should receive adjuvant therapy, and genetic risk low risk score of non-small cell lung cancer patients should receive low dose or from adjuvant therapy.
【技术实现步骤摘要】
预测肺癌病人预后的基因表达分类器及其构建方法
本专利技术涉及一种基因表达分类器及其构建方法,更具体地涉及一种预测肺癌病人预后的基因表达分类器及其构建方法,特别是一种预测非小细胞肺癌病人预后的基因表达分类器及其构建方法。
技术介绍
中国最新癌症流行病学调查显示2015年新增肺癌病人73万,死亡病人60万,肺癌已成为中国发病率和死亡率均处于首位的癌症(1)。肺癌死亡例数占总体癌症死亡例数的25%。由于肺癌的高复发风险和低存活率,绝大多数处于IB-IIIA期的肺癌病人都会进行术后化疗(postoperativechemotherapy,POCT)。此外,基于病灶残留程度、淋巴结转移情况、癌症分期等参数,相当一部分的肺癌病人也会进行术后放疗(postoperativeradiotherapy,PORT)(2-4)。人类癌症具有高度异质性,即使临床上被诊断为同一分期的癌症病人对于同样的治疗方案的反应和总体预后也会大不相同(5)。换言之,有相当一部分病人不能从辅助疗法中获得生存益处或者只能获得很少的生存益处,却要忍受不必要的放化疗痛苦(6-8)。近年来,科学家们一直尝试基于癌症的基因表达特征来开发相应的分子标记物和分子分类手段。在基因表达分类器领域,乳腺癌开始最早,进展最大,已有多个分子检测产品问世,如OncotypeDX(9,10)、MammaPrint(11,12)、Prosigna(13,14)、EndoPredict(15)以及BreastCancerIndex(16)。其中,OncotypeDX(又称乳腺癌21基因检测)与MammaPrint这两个检测产品发 ...
【技术保护点】
一种预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,包括:数据训练阶段和验证阶段,所述训练阶段包括第一阶段和第二阶段,所述第一阶段使用有监督的机器学习方法建立能预测肺癌病人预后的基因表达分类器雏形,所述第二阶段进一步使用机器学习的方法获得预测肺癌病人预后的基因表达分类器。
【技术特征摘要】
1.一种预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,包括:数据训练阶段和验证阶段,所述训练阶段包括第一阶段和第二阶段,所述第一阶段使用有监督的机器学习方法建立能预测肺癌病人预后的基因表达分类器雏形,所述第二阶段进一步使用机器学习的方法获得预测肺癌病人预后的基因表达分类器。2.根据权利要求1所述的预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,所述第一阶段通过使用肺癌病人的基因表达信息和临床信息,采用有监督的机器学习方法挑选与真实预后情况高度相关的基因。3.根据权利要求2所述的预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,对所有基因的表达和预后情况的Pearson系数的绝对值由大到小排序,获得与真实一年内复发高度相关的基因。4.根据权利要求1所述的预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,使用LOOCV方法获得最佳的基因类别和数目,建立所述基因表达分类器雏形。5.根据权利要求4所述的预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,使用基因表达分类器雏形计算用于验证的肿瘤样本的风险系数,预测其复发风险,通过比较真实复发风险和预测复发风险的一致性,验证所述基因表达分类器雏形的效能。6.根据权利要求1所述的预测肺癌病人预后的基因表达分类器的构建方法,其特征在于,第一阶段的基因表达分类器雏形包...
【专利技术属性】
技术研发人员:王俊,陆晓,顾凯,郝文山,
申请(专利权)人:南京高新生物医药公共服务平台有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。