基于深度图神经网络的药物-疾病关联预测方法技术

技术编号:37961246 阅读:8 留言:0更新日期:2023-06-30 09:36
本发明专利技术公开了一种基于深度图神经网络的药物

【技术实现步骤摘要】
基于深度图神经网络的药物

疾病关联预测方法


[0001]本专利技术涉及生物信息
,更具体的说是涉及一种基于深度图神经网络的药物

疾病关联预测方法。

技术介绍

[0002]传统的药物研发具有周期长,投入大,风险高等缺点。因此,越来越多的研究人员开始利用计算机辅助研发药物的新适应症,即药物重定位。药物重定位已经取得了一些成就,比如,治疗真菌感染的两性霉素B,被重新发现并应用于利什曼病的治疗;治疗帕金森病的溴隐亭被用于治理糖尿病。当前,药物重定位研究方法主要分为两大类:基于矩阵分解或矩阵完成的推荐方法以及基于不同网络的机器学习或深度学习方法。
[0003]为了开发出更高效、更精确的药物重定位预测算法,来自许多不同领域的各种技术已被纳入生物信息学领域。特别是,诸如矩阵分解或矩阵完成等技术已经成功地应用于发现新的药物

靶点和药物

疾病相互作用。与其他方法相比,基于推荐模型的计算药物重定位方法不需要负样本,可以灵活地整合更多的先验信息,因此可以用于药物重定位的预测。比如,MSBMF通过将药物和疾病的相似性矩阵分别连接,再应用多相似度的双线性矩阵分解方法来预测现有药物的相关适应病症。ANMF通过增强药物和疾病的表示信息和自动编码器发现药物与疾病的特征,最终通过广义矩阵分解方法完成结果预测。
[0004]随着技术的不断更新迭代,机器学习与深度学习方法也已经被应用到了药物重定位的研究中。例如,NEDD利用元路径来明确地捕获药物和疾病之间的间接关系或高阶邻近性。CTST模型提取和整合多个异构网络和子网中的常见和特定拓扑,然后通过多种自编码器与注意机制实现最终的关联预测。
[0005]尽管很多方法被证实是有效的,但目前的研究还存在一些局限性。一方面,深度学习模型分解模型的性能受到现有关联信息的高度影响,当实验数据本身是高度稀疏时,现有方法将很难实现高质量的预测。另一方面,在药物重定位研究中,药物与疾病特征(嵌入)表示的提取关乎整个模型预测的精度。然而,以往的研究大多只是将药物或疾病的不同特征进行线性连接,无法充分挖掘潜在的特征信息。
[0006]因此,如何提供一种可提高预测精度的基于深度图神经网络的药物

疾病关联预测方法,成为本领域技术人员亟需解决的技术问题。

技术实现思路

[0007]有鉴于此,本专利技术提供了一种基于深度图神经网络的药物

疾病关联预测方法,可更好的获取药物与疾病之间的相互作用信息,提高潜在的药物

疾病关联预测精度。
[0008]为了实现上述目的,本专利技术采用如下技术方案:
[0009]一种基于深度图神经网络的药物

疾病关联预测方法,包括:
[0010]基于相关研究资料,得到药物的多源相似性特征数据、疾病的多源相似性特征数据以及药物

疾病的原始关联矩阵;
[0011]采用高斯核函数分别对药物的多源相似性特征数据和疾病的多源相似性特征数据进行相似性度量,构建药物的相似性矩阵和疾病的相似性矩阵;
[0012]利用药物和疾病的相似性矩阵对所述原始关联矩阵进行随机游走,得到随机游走后的药物

疾病关联矩阵;
[0013]分别将药物和疾病的相似性矩阵输入至两个独立的图神经网络中,所述图神经网络利用随机游走后的药物

疾病关联矩阵进行监督学习,提取药物和疾病的特征表示;
[0014]利用矩阵整合药物和疾病的特征表示,得到本次监督学习的药物

疾病预测关联矩阵;
[0015]将本次的药物

疾病预测关联矩阵代替随机游走后的药物

疾病关联矩阵,使两个图神经网络重复进行上述监督学习,直至满足预设优化目标,得到最终的预测模型。
[0016]进一步的,药物的多源相似性特征数据包括:化学亚结构相似性数据、靶点蛋白质结构域相似性数据和基因本体注释相似性数据;疾病的多源相似性特征数据包括:疾病表型相似性数据和疾病本体相似性数据。
[0017]进一步的,药物的相似性矩阵的构建过程为:
[0018]将药物的多源相似性特征数据对应组成多个相似性矩阵,并进行线性拼接,构成药物的综合相似性矩阵DR,其中,DR的第i列表示为第i种药物的三种不同属性组成的特征向量;
[0019]将获得的药物特征向量,两两之间计算欧几里得距离,再计算药物两两之间的高斯核函数值,并将高斯核函数值视为这两种药物的相似性值;
[0020]将各个特征下的药物间的相似性值进行整合,构建药物的相似性矩阵。
[0021]进一步的,两种药物的相似性值的计算公式为:
[0022][0023]其中,Sim
dr
(i,j)表示第i种药物与第j种药物的综合相似性表示;DR
*,i
表示DR的第i列,DR
*,j
表示DR的第j列;σ取0.5,||
·
||表示欧几里得距离。
[0024]进一步的,疾病的相似性矩阵的构建过程与药物的相似性矩阵构建过程一致。
[0025]进一步的,对所述原始关联矩阵的随机游走过程包括:
[0026]将所述原始关联矩阵进行归一化处理后,分别利用药物的相似性矩阵和疾病的相似性矩阵进行双向随机游走,对所述原始关联矩阵进行变换;
[0027]迭代多次后对药物空间游走结果与疾病空间游走结果进行算术平均,得到游走后的药物

疾病关联矩阵,表示为其中,表示m*n维的实矩阵空间,m表示药物数量,n表示疾病数量。
[0028]进一步的,利用图神经网络对药物和疾病的特征提取过程包括:
[0029]将药物与疾病的关联关系分为正样本与负样本,当某一药物与某一疾病有关联时为正样本,反之为负样本;
[0030]利用游走后的药物

疾病关联矩阵监督图神经网络的学习过程,计算每一次训练的误差,并根据误差调整神经元;
[0031]利用两个独立的图神经网络分别得到药物与疾病的特征向量矩阵X,Y。
[0032]进一步的,还包括:利用非线性全连接层对获得的药物与疾病的特征向量矩阵X,Y再次进行特征提取,替代矩阵完成过程中的特征线性拼接,得到药物与疾病的最佳特征表示。
[0033]进一步的,第t次监督学习中的药物

疾病预测关联矩阵的表示形式为:
[0034][0035]其中,表示矩阵乘积,t表示学习次数,X,Y分别表示两个图神经网络提取的药物特征向量矩阵和疾病特征向量矩阵。
[0036]进一步的,所述图神经网络的优化目标为:
[0037][0038]其中,A表示药物

疾病的原始关联矩阵;δ表示正样本;表示负样本;α表示权重系数;||
·
||
F
...

【技术保护点】

【技术特征摘要】
1.一种基于深度图神经网络的药物

疾病关联预测方法,其特征在于,包括:基于相关研究资料,得到药物的多源相似性特征数据、疾病的多源相似性特征数据以及药物

疾病的原始关联矩阵;采用高斯核函数分别对药物的多源相似性特征数据和疾病的多源相似性特征数据进行相似性度量,构建药物的相似性矩阵和疾病的相似性矩阵;利用药物和疾病的相似性矩阵对所述原始关联矩阵进行随机游走,得到随机游走后的药物

疾病关联矩阵;分别将药物和疾病的相似性矩阵输入至两个独立的图神经网络中,所述图神经网络利用随机游走后的药物

疾病关联矩阵进行监督学习,提取药物和疾病的特征表示;利用矩阵整合药物和疾病的特征表示,得到本次监督学习的药物

疾病预测关联矩阵;将本次的药物

疾病预测关联矩阵代替随机游走后的药物

疾病关联矩阵,使两个图神经网络重复进行上述监督学习,直至满足预设优化目标,得到最终的预测模型。2.根据权利要求1所述的基于深度图神经网络的药物

疾病关联预测方法,其特征在于,药物的多源相似性特征数据包括:化学亚结构相似性数据、靶点蛋白质结构域相似性数据和基因本体注释相似性数据;疾病的多源相似性特征数据包括:疾病表型相似性数据和疾病本体相似性数据。3.根据权利要求1所述的基于深度图神经网络的药物

疾病关联预测方法,其特征在于,药物的相似性矩阵的构建过程为:将药物的多源相似性特征数据对应组成多个相似性矩阵,并进行线性拼接,构成药物的综合相似性矩阵DR,其中,DR的第i列表示为第i种药物的三种不同属性组成的特征向量;将获得的药物特征向量,两两之间计算欧几里得距离,再计算药物两两之间的高斯核函数值,并将高斯核函数值视为这两种药物的相似性值;将各个特征下的药物间的相似性值进行整合,构建药物的相似性矩阵。4.根据权利要求3所述的基于深度图神经网络的药物

疾病关联预测方法,其特征在于,两种药物的相似性值的计算公式为:其中,Sim
dr
(i,j)表示第i种药物与第j种药物的综合相似性表示;DR
*,i
表示DR的第i列,DR
*,j
表示DR的第j列;σ取0.5,||
·
||表示欧几里得距离。5.根据权...

【专利技术属性】
技术研发人员:滕志霞李永亮董本志汪国华
申请(专利权)人:东北林业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1