基于图神经网络的miRNA-疾病关联预测制造技术

技术编号:32832105 阅读:22 留言:0更新日期:2022-03-26 20:46
本发明专利技术提供了基于图神经网络的miRNA

【技术实现步骤摘要】
基于图神经网络的miRNA

疾病关联预测


[0001]本专利技术涉及特征提取方法,尤其涉及一种基于图神经网络的局部特征提取手法。

技术介绍

[0002]研究表明,miRNA作为一种非编码RNA参与调控了各个层次的生命活动和大部分的病理过程。识别与疾病相关的miRNA对疾病的诊断和治疗有重大意义,但是传统的生物实验具有很大的不确定性且费时费力,因此需要先进的智能计算模型解决此问题。目前,主要通过得分模型、机器学习算法、深度学习算法来实现miRNA

疾病关联预测。
[0003]传统的神经网络模型在提取欧式空间数据方面取得了较大的成功,但是对于不规则的非欧式空间数据则比较吃力。所以图神经网络应运而生,图神经网络的主要思想是首先寻找中心节点的邻居节点,进而通过一定的方法将邻居节点所携带的信息聚集到中心节点。通过这样的思想学到的特征表示不仅所携带的信息更加丰富了,而且一定程度上还可以保护图的拓扑结构。因此我们的方法选用GraphSAGE模型提取miRNA和疾病的特征表示。

技术实现思路

[0004]鉴于此专利技术提出了基于图神经网络的miRNA

疾病关联预测。本专利技术利用图的局部信息,为每个miRNA、疾病对学习丰富的特征表示。
[0005]本专利技术所采用的技术方案如下:
[0006]A、基于疾病语义相似度和高斯轮廓核相似度计算疾病初始特征表示,基于miRNA功能相似度和高斯轮廓核相似度计算miRNA初始特征表示。
[0007]B、基于miRNA和疾病的初始特征表示构建图神经网络编码器的输入数据。
[0008]C、基于GraphSAGE的miRNA、疾病潜在特征提取。
[0009]D、基于深度神经网络构建得分预测模型。
[0010]E、基于交叉熵损失函数反向传播训练模型参数。
[0011]根据权A所述的基于疾病语义相似度和高斯轮廓核相似度计算疾病初始特征表示,基于miRNA功能相似度和高斯轮廓核相似度计算miRNA初始特征表示。本专利技术使用从HMDD数据库中下载已知的miRNA

疾病关联数据,在MESH数据库中下载疾病语义描述并构建有向无环图。通过构建的有向无环图分别计算疾病语义相似度和miRNA功能相似度,利用已知的关联矩阵计算疾病和miRNA的高斯轮廓核相似度,最后将两种相似聚合。
[0012]根据B所述的基于miRNA和疾病的初始特征表示构建图神经网络编码器的输入数据。由于本专利技术使用DGL框架构建图神经网络模型,模型的输入数据为图和节点的特征表示,并且特征表示要求嵌入维度相同。所以对疾病和miRNA的初始特征表示进行特征映射,将它们统一为相同的维度。
[0013]根据C所述的基于GraphSAGE的miRNA、疾病潜在特征提取。本专利技术构建了三层的GraphSAGE网络,GraphSAGE的第一步骤为选择中心节点的邻居节点,第二步为聚合邻居节点信息到中心节点。在聚合信息阶段,本专利技术使用MEAN聚合器。
[0014]根据权利D所述的基于深度神经网络构建得分预测模型。本专利技术构建三层全连接层网络,两层隐藏层,并且层与层之间使用Relu激活函数。最后为得分预测输出层,使用sigmoid激活函数激活后输出。
[0015]根据权利E所述的基于交叉熵损失函数反向传播训练模型参数。本专利技术通过交叉熵损失函数计算预测值和标签之间的差别用于反向传播训练模型获得最优参数。
[0016]本专利技术提供的技术方案带来的有益效果是:
[0017]本专利技术将GraphSAGE模型运用到miRNA

疾病关联预测领域,利用较少的已知的关联数据预测未知的miRNA

疾病关联,降低了传统生物实验的成本,并且大大减少了关联预测的时间。将本专利技术运用到现实生活中具有很大的意义,本专利技术可以为疾病预测出其潜在的相关miRNA,为疾病的诊断、治疗和新药的研发提供了借鉴意义。
附图说明
[0018]图1为本专利技术基于图神经网络的miRNA

疾病关联预测方法流程示意图;
具体实施方式
[0019]为使本专利技术的目的、技术方案与优点更加清楚,下面结合附图对本专利技术的特征检测方法作进一步详细的说明。
[0020]数据预处理阶段,数据来源于HMDD数据库和MESH数据库,并通过这两个数据库获得疾病和miRNA节点的初始特征表示,并构建miRNA

疾病关联二部图。
[0021]将构建的二部图输入到GraphSAGE编码器中,通过在图的拓扑上聚合局部节点的信息,丰富中心节点的嵌入表示,从而提高模型预测的准确率。
[0022]将学习到的miRNA和疾病的潜在特征表示加权拼接,构成深度神经网络的输入数据。预测miRNA

疾病的关联分数,并利用交叉熵损失函数计算损失,反向传播,训练模型参数。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于图神经网络的miRNA

疾病关联预测,包括以下部分:A、基于疾病语义相似度和高斯轮廓核相似度计算疾病初始特征表示,基于miRNA功能相似度和高斯轮廓核相似度计算miRNA初始特征表示。B、基于miRNA和疾病的初始特征表示构建图神经网络编码器的输入数据。C、基于GraphSAGE的miRNA、疾病潜在特征提取。D、基于深度神经网络构建得分预测模型。E、基于交叉熵损失函数反向传播训练模型参数。2.根据权利要求1所述的基于疾病语义相似度和高斯轮廓核相似度计算疾病初始特征表示,基于miRNA功能相似度和高斯轮廓核相似度计算miRNA初始特征表示。本发明使用从HMDD数据库中下载已知的miRNA

疾病关联数据,在MESH数据库中下载疾病语义描述并构建有向无环图。通过构建的有向无环图分别计算疾病语义相似度和miRNA功能相似度,利用已知的关联矩阵计算疾病和miRNA的高斯轮廓核相似度,最后将两种相似聚合。3.根...

【专利技术属性】
技术研发人员:庞善臣庄雨
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1