一种基于GCN编码DNN解码的miRNA-disease关联预测方法技术

技术编号:42582165 阅读:23 留言:0更新日期:2024-09-03 18:00
本发明专利技术公开了一种基于GCN编码DNN解码的miRNA‑disease关联预测方法。本发明专利技术中,利用图卷积网络(GCN)来吸收和学习网络中节点的高阶特征,从而有效地捕捉miRNA与疾病之间的复杂关系。在研究中,通过融合多模态网络中一层的混合高阶邻域信息,以Cm为例介绍了mirna的学习表示过程。除此之外,GCN还考虑了不同距离上miRNA的邻域信息,进一步增强了miRNA的特征表达能力。通过创新的GCN编码方法,通过融合多模态网络中的混合高阶邻域信息来学习miRNA和疾病的表征;DNN解码部分,使用深度神经网络对GCN编码的特征进行解码,实现miRNA‑disease关联的预测;关联预测性能的提升,相比传统方法具有更好的预测性能。

【技术实现步骤摘要】

本专利技术属于生物信息学,具体为一种基于gcn编码dnn解码的mirna-disease关联预测方法。


技术介绍

1、mirna-disease关联预测是在生物医学研究中的重要任务,旨在揭示mirna与疾病之间的关联关系。传统的mirna-disease关联预测方法主要包括基于实验和基于计算生物学方法。基于实验的方法需要昂贵且耗时的实验过程来测量mirna和疾病之间的关联性,而基于计算生物学方法则利用已知的mirna和疾病数据进行预测。然而,这些传统方法存在数据不完整、特征表示有限以及预测模型局限性等局限性。数据的可用性和质量有限,特征表示缺乏全面性,预测模型无法充分考虑mirna和疾病的复杂关联。因此,基于图神经网络的方法成为解决mirna-disease关联预测问题的有效途径。gcn是一种常用的图神经网络,可以对图结构数据进行学习和表示,而dnn则可以用于模型的解码和预测过程。

2、现有技术方案:目前,已有一些基于gcn和dnn的mirna-disease关联预测方法。这些方法通过将mirna和疾病转化为图的节点,并通过gcn编码学习节点表本文档来自技高网...

【技术保护点】

1.一种基于GCN编码DNN解码的miRNA-disease关联预测方法,其特征在于:所述方法包括以下步骤:

2.如权利要求1所述的一种基于GCN编码DNN解码的miRNA-disease关联预测方法,其特征在于:所述步骤S1中,首先,从公共数据库收集了miRNA表达数据、疾病遗传信息以及已知的miRNA-疾病关联信息来准备数据集;利用MeSH(Medical Subject Headings)系统对疾病的相关医学文献进行分类和检索,HMDD(Human MicroRNA Disease Database)来获取已知的miRNA-疾病关联数据,以及MISIM数据库来评估miR...

【技术特征摘要】

1.一种基于gcn编码dnn解码的mirna-disease关联预测方法,其特征在于:所述方法包括以下步骤:

2.如权利要求1所述的一种基于gcn编码dnn解码的mirna-disease关联预测方法,其特征在于:所述步骤s1中,首先,从公共数据库收集了mirna表达数据、疾病遗传信息以及已知的mirna-疾病关联信息来准备数据集;利用mesh(medical subject headings)系统对疾病的相关医学文献进行分类和检索,hmdd(human microrna disease database)来获取已知的mirna-疾病关联数据,以及misim数据库来评估mirnas之间的相似性;基于以上内容,本方法构建了一个初步的mirna-疾病异质网络,该网络不仅考虑了mirna与疾病的直接关系,还包括了mirna之间和疾病之间的潜在联系;通过这种方式,本方法设置了一个全面的框架,用于进一步应用图卷积网络(gcn)作为编码器和深度神经网络(dnn)作为解码器,以学习这些交互关系并有效地预测未知的mirna-疾病关联;构建异构网络:其中包括mirna-mirna相似性网络(用mirna功能相似性、mirna表达相似性和高斯内核相似性构建)、疾病-疾病相似性网络(用疾病语义相似性和高斯核相似性构建)和经过验证的mirna-疾病关联网络。

3.如权利要求2所述的一种基于gcn编码dnn解码的mirna-disease关联预测方法,其特征在于:所述mirna-mirna相似性网络构建了一个mirna功能相似性矩阵fsm,其中fsm(i,j)是mirnai和mirnaj之间的相似性值;mirna的高斯相互作用概况(gip)内核相似性用于描述mirna之间的关系[44],mirnai和mirnaj之间的gip核相似性计算如下:

4.如权利要求2所述的一种基于gcn编码dnn解码的mirna-disease关联预测方法,其特征在于:所述疾病-疾病相似性网络通过两种基于语义的方法和一种基于gip内核的方法计算;语义相似性是以mesh数据库为基础进行计算的,其中包含两个模型;在模型1中,本方法针对每种疾病构建了分层定向非循环图(dag);对于特定疾病d来说,其dag(d)=(d,h(d),f(d)),其中h(d)是包含d本身及其所有祖先节点的节点集合,而f(d)则包含了从mesh数据库获得的与d相关的父节点和子节点的边缘关系;针对dag(d)中的每个与d相关的疾病p,它对疾病d的语义值d1d(p)...

【专利技术属性】
技术研发人员:窦欣雨祝小雷刘银博
申请(专利权)人:安徽农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1