【技术实现步骤摘要】
一种早期NSCLC预后预测系统
本专利技术涉及基因工程和肿瘤医学
,具体为一种早期NSCLC预后预测系统。
技术介绍
肺癌位居全球癌症死因的首位,一个准确的预后预测模型可以帮助临床医生临床决策或指导辅助治疗;尽管病人宏观临床信息和肿瘤特征已被普遍用作有效预测指标,但越来越多的证据表明,分子生物标记物可以提供早期预警信号;原因在于,即便当肿瘤大小不能被检测到时(<0.01cm3),肿瘤细胞亦可发生转移,并出现某些生物标记物的异常;因此,一个包括遗传和外在非遗传因素的预后预测模型,在临床应用中,是十分有价值的。目前虽已有部分研究针对早期NSCLC建立预后预测模型,但其预测效果不佳(AUC<0.8),且样本量较小;其原因可能在于:(1)组学数据类型局限:基于组学数据,已有研究提出了与肺癌预后相关的生物标志物,包括DNA甲基化,基因表达,microRNA和长链非编码RNA等;然而,大多数研究仅限于单一组学,这导致预后预测模型精度不够理想;(2)考虑信息不全:目前几乎无大规模的研究,纳入基因-环境(GxE)、 ...
【技术保护点】
1.一种早期NSCLC预后预测模型,其特征在于,包括:/n数据清洗模块,用于收集和清理样本数据,其中,数据类型包括甲基化数据和基因表达数据,并进行甲基化与基因表达的全基因组质控;/n主效应识别模块,主效应识别模块与数据清洗模块相连,用于对筛选对于预后有主效应的预测因子;/n交互作用识别模块,交互作用识别模块与数据清洗模块相连,用于筛选对于预后有交互效应的预测因子;/n生存时间预测模块,所述生存时间预测模块分别与数据清洗模块、主效应识别模块和交互作用识别模块相连,构建生存预测模型,用于预测患者三年和五年的生存概率,生存预测模型为:/nHazard(3year)=baselin ...
【技术特征摘要】 【专利技术属性】
1.一种早期NSCLC预后预测模型,其特征在于,包括:
数据清洗模块,用于收集和清理样本数据,其中,数据类型包括甲基化数据和基因表达数据,并进行甲基化与基因表达的全基因组质控;
主效应识别模块,主效应识别模块与数据清洗模块相连,用于对筛选对于预后有主效应的预测因子;
交互作用识别模块,交互作用识别模块与数据清洗模块相连,用于筛选对于预后有交互效应的预测因子;
生存时间预测模块,所述生存时间预测模块分别与数据清洗模块、主效应识别模块和交互作用识别模块相连,构建生存预测模型,用于预测患者三年和五年的生存概率,生存预测模型为:
Hazard(3year)=baselinebazard(3year)×exp(β1X1+...βiXi);
其中,等式的右边是模型的具体函数,左边表示预测概率,βi表示模型的系数,baselinehazard为基线风险,对应于所有变量都取值为0时的风险;
高危人群甄别模块,高危人群甄别模块与生存时间预测模块相连,用于区分个体预后风险,包括高危、中危和低危。
2.根据权利要求1所述的一种早期NSCLC预后预测模型,其特征在于:所述数据清洗模块收集样本数据的具体方法为,以标准操作程序采集符合标准的血液或组织样本,系统收集完整的人口学随访资料和临床资料,并采用基因组芯片扫描以获取疾病相关的甲基化和基因表达谱,建立统一标准的样本数据库。
3.根据权利要求1所述的一种早期NSCLC预后预测模型,其特征在于:所述数据清洗模块对收集的数据进行甲基化与基因表达的全基因组质控的方法为,利用高密度甲基化和基因表达探针,筛选与早期NSCLC预后有阳性关联的甲基化和基因表达,对于甲基化数据,使用IlluminaInfiniumHumanMethylation450BeadChips分析DNA甲基化,将原始图像数据导入GenomeStudio甲基化模块V1.8,以计算甲基化信号,并执行归一化、背景扣除和质量控制,对于基因表达数据,包括TCGA数据和GEO数据,进行mRNA测序数据处理和质量控制,使用RNA测序通过期望最大化将原始计数标准化,并从TCGA数据网站下载了Level-3基因定量数,进一步质量控制。
技术研发人员:张汝阳,魏永越,陈峰,陈超,沈思鹏,赵杨,林丽娟,董学思,陈家进,
申请(专利权)人:南京医科大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。