【技术实现步骤摘要】
一种基于深度嵌入卷积神经网络的模体挖掘方法
[0001]本专利技术涉及计算机识别与深度学习
,特别是涉及一种基于深度嵌入卷积神经网络的模体挖掘方法。
技术介绍
[0002]转录因子在基因转录、修复和调控等生物过程中有着重要的作用。转录因子绑定位点的基因变异与某些重大疾病有密切关联。因此,挖掘转录因子绑定位点或者说模体挖掘对于理解转录因子的调控机制有重要影响。传统上,转录因子绑定位点由位置权重矩阵PWM表示,位置权重矩阵通过将模体序列对齐并统计对应位置的核苷酸分布计算而来。然而,PWM只关注了模体序列的核苷酸分布,而忽略了模体邻近序列的信息,案例研究显示,模体的上下文序列信息对于绑定行为有重大影响。受位置权重矩阵的启发,DeepBind构建了一个单层卷积神经网络模型用于模体挖掘任务,研究表明,绑定位点邻近序列的核苷酸分布对绑定行为有重要影响。在实际的生物过程中,多个转录因子可能互相协同,共同影响绑定过程。因此,在一段序列中可能存在模体与模体之间的相互作用,单层卷积网络对于这种情况同样无能为力。
[0003]PWM ...
【技术保护点】
【技术特征摘要】
1.一种基于深度嵌入卷积神经网络的模体挖掘方法,其特征在于,包括以下步骤:S1、构建深度嵌入卷积神经网络eDeepCNN模型;S2、对DNA序列进行K
‑
mer编码,利用嵌入向量作为所述eDeepCNN模型中K
‑
mer的输入表示,对所述eDeepCNN模型的数据集进行训练,并进行特征提取和绑定预测;S3、将所述eDeepCNN模型与浅层网络对比,用于验证所述eDeepCNN模型的优越性。2.根据权利要求1所述的基于深度嵌入卷积神经网络的模体挖掘方法,其特征在于,S1中所述eDeepCNN模型中包括三个卷积层,每个卷积层后布设有一个局部最大池化层和一个丢失层,用于帮助所述深度嵌入卷积神经网络模型对抗训练过程中的过拟合现象。3.根据权利要求2所述的基于深度嵌入卷积神经网络的模体挖掘方法,其特征在于,所述三个卷积层分别为:第一卷积层、第二卷积层和第三卷积层,所述第一卷积层用于负责抽取序列局部模式,所述第二卷积层和第三卷积层则对所述局部模式之间的相互作用进行建模。4.根据权利要求3所述的基于深度嵌入卷积神经网络的模体挖掘方法,其特征在于,所述第一卷积层经过计算得到模体得分序列,作为所述第二卷积层的输入,识别所述得分序列的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。