一种基于深度神经网络的乳腺癌生存期预测方法技术

技术编号:24173929 阅读:42 留言:0更新日期:2020-05-16 03:55
本发明专利技术涉一种基于深度神经网络的乳腺癌生存期预测方法,包括以下步骤:1)获取数据;所述数据为临床数据和组学数据,组学数据包括基因表达数据和DNA甲基化数据;2)对数据进行预处理;3)数据集特征提取;4)构建深度神经网络。本发明专利技术采用深度神经网络融合乳腺癌的多组学数据进行生存期预测,从TCGA数据库中获取乳腺癌临床数据、基因表达数据、DNA甲基化数据,提取数据特征,分别构建深度神经网络模型,然后进行后端融合,提升乳腺癌生存期预测性能,获得生存期预测模型;本发明专利技术在乳腺癌生存期预测中作用显著。

【技术实现步骤摘要】
一种基于深度神经网络的乳腺癌生存期预测方法
本专利技术属于生物医学工程领域,涉及一种基于深度神经网络的乳腺癌生存期预测方法。
技术介绍
乳腺癌是女性最常见的恶性肿瘤之一,根据资料显示,全球每年约有120万新增的女性乳腺癌患者,并且每年约有50万女性死于乳腺癌。经研究,乳腺癌是一种容易引起转移的疾病,经手术治疗后约50%的病例可以治愈,其余50%的病例则可能发生复发或转移。随着乳腺癌的发病率逐渐升高,对癌症患者进行精准预后预测是当前所面临癌症问题的关键。预后指的是预测疾病的可能病程和结局,不仅包括预测某段时间内发生某种结局的可能性,而且包括判断疾病的特定后果。生存期预测作为癌症预后预测的重要研究内容之一,具有十分重要的意义。目前,对于乳腺癌生存期预测主要包括以下两类方法:生存期临床预测方法和生存期计算预测方法。生存期临床预测方法是指临床医生利用临床数据并结合一些非正式的主观方法对患者的生存期做出判断的过程,生存期临床预测评估较为灵活,但因受制于认知偏差的影响而不可避免的降低了预测准确性,而且癌症早期阶段的一些生存期预测因素在晚期即本文档来自技高网...

【技术保护点】
1.一种基于深度神经网络的乳腺癌生存期预测方法,其特征在于,包括以下步骤:/n1)获取数据;所述数据为临床数据和组学数据,组学数据包括基因表达数据和DNA甲基化数据;/n2)对数据进行预处理;/n3)利用最大相关最小冗余算法对数据集特征进行提取;/n4)针对临床数据、基因表达数据和DNA甲基化数据分别构建深度神经网络,然后进行后端融合。/n

【技术特征摘要】
1.一种基于深度神经网络的乳腺癌生存期预测方法,其特征在于,包括以下步骤:
1)获取数据;所述数据为临床数据和组学数据,组学数据包括基因表达数据和DNA甲基化数据;
2)对数据进行预处理;
3)利用最大相关最小冗余算法对数据集特征进行提取;
4)针对临床数据、基因表达数据和DNA甲基化数据分别构建深度神经网络,然后进行后端融合。


2.根据权利要求1所述的一种基于深度神经网络的乳腺癌生存期预测方法,其特征在于,
所述步骤2)中对数据进行预处理,具体为:
对于基因表达数据,首先将超过10%缺失值样本的基因剔除,然后采用基于权值近邻填充算法填充剩余的缺失值,最后用标准分数将表达数据归一化,并设定相应的阀值,将每个表达值离散化;
对DNA甲基化数据做标准分数归一化处理,从而确保两个组学数据的范围在同一尺度内。


3.根据权利要求2所述的一种基于深度神经网络的乳腺癌生存期预测方法,其特征在于:
步骤3)中数据集特征提取,具体为:
对于每一个样本Si,假设它的特征集合为F,那么特征Fi和样本Si之间的相关性REL可以表示为:



其中p(fi,Si)表示两个变量之间的联合概率分布函数。而特征fi和其它所有被选择出的特征之间的冗余度RED可表示为:
...

【专利技术属性】
技术研发人员:艾红殷鹏
申请(专利权)人:深圳先进技术研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1