【技术实现步骤摘要】
一种集成多组学特征的DNA甲基化预测方法
[0001]本专利技术涉及DNA甲基化预测领域,尤其涉及一种集成多组学特征的DNA甲基化预测方法。
技术介绍
[0002]癌组织和癌旁组织的DNA甲基化与癌症的发生、发展密切相关,分析DNA甲基化的变异有助于揭示癌症的分子生物学机制。已有研究仅使用单一组学预测DNA甲基化较为困难,随着测序技术的快速发展,研究人员已经获得了海量的多种生物组学数据,且癌组织和癌旁组织的DNA甲基化与多组学数据间存在显著关联,因此利用集成多组学特征预测DNA甲基化是非常有必要的。综上所述,DNA甲基化数据对于癌症研究非常重要,现有研究仅使用单一组学预测DNA甲基化,一种组学特征提供的生物学信息较为单一,对DNA甲基化数据的预测效果不佳。
技术实现思路
[0003]本专利技术提供一种集成多组学特征的DNA甲基化预测方法,以克服上述技术问题。
[0004]一种集成多组学特征的DNA甲基化预测方法,包括,
[0005]步骤一、确定待预测CpG位点,获取癌旁组织中CpG位点的多组学 ...
【技术保护点】
【技术特征摘要】
1.一种集成多组学特征的DNA甲基化预测方法,其特征在于,包括,步骤一、确定待预测CpG位点,获取癌旁组织中CpG位点的多组学特征集,所述多组学特征集包括miRNA特征集、mRNA特征集、甲基化特征集,获取癌组织中CpG位点的甲基化特征集,步骤二、基于Pearson相关系数分别计算癌组织CpG位点的甲基化特征与癌旁组织的miRNA特征、mRNA特征、甲基化特征之间的相关系数,根据癌组织CpG位点的甲基化特征与癌旁组织的miRNA特征的相关系数的取值从miRNA特征集中选择K个miRNA特征,根据癌组织CpG位点的甲基化特征与癌旁组织的mRNA特征的的相关系数的取值从mRNA特征集中选择Q个mRNA特征,根据癌组织CpG位点的甲基化特征与癌旁组织的甲基化特征的的相关系数的取值从甲基化特征集中选择L个甲基化特征,步骤三、根据K个miRNA特征、Q个mRNA特征以及L个甲基化特征构建多组学相关特征集,基于深度神经网络构建DNA甲基化预测模型,根据多组学相关特征集对DNA甲基化预测模型进行训练,计算训练后的DNA甲基化预测模型的评估指标,当评估指标满足阈值时获取评估后的DNA甲基化预测模型,根据评估后的DNA甲基化预测模型对癌组织的甲基化进行预测。2.根据权利要求1所述的一种集成多组学特征的DNA甲基化预测方法,其特征在于,所述基于Pearson相关系数分别计算癌组织CpG位点的甲基化特征与癌旁组织的miRNA特征、mRNA特征、甲基化特征之间的相关系数包括根据公式(1)计算相关系数,其中x
i
代表多组学特征集中第i个样本癌旁组织的CpG位点甲基化特征值、mRNA特征值或者miRNA特征值,表示该CpG位点所有样本的特征均值;y
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。