一种预测癌症的方法及系统技术方案

技术编号:26261306 阅读:62 留言:0更新日期:2020-11-06 17:58
本发明专利技术公开了一种预测癌症的方法及系统,该方法包括:针对癌症病人与正常人的基因表达谱数据进行差异性分析,获得差异性基因;基于加权基因共表达网络分析对癌症病人与正常人的基因表达谱数据进行分析,得到枢纽基因;并通过变分自编码器算法对差异性基因的基因表达谱数据进行处理,得到降维数据;将枢纽基因的基因表达谱数据和降维数据共同作为预设类型的癌症分类器的分类特征,通过癌症分类器实现癌症病人与正常人的精准分类。本发明专利技术的预测癌症的方法及系统将加权基因共表达网络分析得到的枢纽基因的基因表达谱数据和变分自编码器处理后的降维数据共同作为癌症分类器的分类特征,从而有效提高了癌症分类器的准确率,达到了高效预测癌症的目的。

【技术实现步骤摘要】
一种预测癌症的方法及系统
本专利技术涉及生物信息学与计算生物学
,特别涉及一种基于变分自编码器和加权基因共表达网络的预测癌症的方法及系统。
技术介绍
结直肠癌(CRC)是世界范围内发病率排名第三、死亡率排名第二的恶性肿瘤。尽管医疗技术不断进步,但大多数CRC患者因疼痛而住院时癌症已经处于中晚期,癌症预后标志物对癌症的早期诊断有很重要意义,而精准医疗需要分类模型进行准确筛选和诊断。为了提高微阵列基因表达数据集预测CRC的准确性,特征提取方法是影响分类器性能的关键因素。对基因表达谱数据的特征提取方法有很多,其中为了筛选和诊断癌症,研究人员通常关注那些在癌症样本和正常样本之间表达有显著差异的基因。致病性癌基因通常是相关的,癌症的发生是多种基因异常表达的结果。如果某一生理过程中某些基因在不同组织间表达相似,那么这些基因在功能上是相关的,因此可将其视为一个完整的组。对微阵列基因表达数据进行分析,根据相关性对基因进行分组,形成基因模块,利用得到的基因模块对癌症进行早期诊断。除了寻找基因模块的方法外,研究人员还利用神经网络直接对微阵列基本文档来自技高网...

【技术保护点】
1.一种预测癌症的方法,其特征在于,所述预测癌症的方法包括:/n针对癌症病人与正常人的基因表达谱数据进行差异性分析,获得癌症病人与正常人之间的差异性基因;/n基于加权基因共表达网络分析对癌症病人与正常人的基因表达谱数据进行分析,得到枢纽基因;并通过变分自编码器算法对所述差异性基因的基因表达谱数据进行处理,得到降维数据;/n将所述枢纽基因的基因表达谱数据和所述降维数据共同作为预设类型的癌症分类器的分类特征,以通过所述癌症分类器实现癌症病人与正常人的分类。/n

【技术特征摘要】
1.一种预测癌症的方法,其特征在于,所述预测癌症的方法包括:
针对癌症病人与正常人的基因表达谱数据进行差异性分析,获得癌症病人与正常人之间的差异性基因;
基于加权基因共表达网络分析对癌症病人与正常人的基因表达谱数据进行分析,得到枢纽基因;并通过变分自编码器算法对所述差异性基因的基因表达谱数据进行处理,得到降维数据;
将所述枢纽基因的基因表达谱数据和所述降维数据共同作为预设类型的癌症分类器的分类特征,以通过所述癌症分类器实现癌症病人与正常人的分类。


2.如权利要求1所述的预测癌症的方法,其特征在于,所述针对癌症病人与正常人的基因表达谱数据进行差异性分析,获得癌症病人与正常人之间的差异性基因,包括:
分别获取癌症病人和正常人的基因表达谱数据,并通过R语言中的limma包实现癌症病人和正常人的基因表达谱数据的基因差异表达分析;
运用R语言中的FDR校正工具包对P-value值进行校正,选择差异性大小满足预设阈值,且在正常人和癌症病人中的基因表达量差异在两倍以上的基因作为所述差异性基因,并确定所述差异性基因的基因表达谱数据。


3.如权利要求1所述的预测癌症的方法,其特征在于,基于所述加权基因共表达网络分析对癌症病人与正常人的基因表达谱数据进行分析,得到枢纽基因,包括:
基于加权基因共表达网络分析对癌症病人与正常人的基因表达谱数据进行分析,将癌症病人与正常人的基因表达谱数据中对应的基因按照相关性进行分类,确定对应的基因模块;
选择所述基因模块中基因的表达数据与表型性状相关系数的绝对值大于0.5和基因的表达数据与模块主成分分析第一主成分相关性绝对值大于0.8的基因,在这些基因里筛选出符合差异性基因条件并在所在模块中连接度最大的前十个基因作为所述枢纽基因;
并对得到的枢纽基因进行预设基因数据库途径富集分析,探讨癌症与枢纽基因在基因功能与代谢通路上的关联。


4.如权利要求1所述的预测癌症的方法,其特征在于,所述变分自编码器的神经网络模型共七层,包括一个输入层、一个输出层和五个隐藏层。


5.如权利要求4所述的预测癌症的方法,其特征在于,所述五个隐藏层的节点分别为584、100、10、100、584个,所述输入层和输出层节点为1186个。


6.如权利要求1-5任一项所述的预测...

【专利技术属性】
技术研发人员:艾冬梅王瑜多潘鸿飞
申请(专利权)人:北京科技大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1