基于图注意力的微生物与药物关联关系预测方法及系统技术方案

技术编号:36749261 阅读:81 留言:0更新日期:2023-03-04 10:34
本发明专利技术基于图注意力的微生物与药物关联关系预测方法,包括以下步骤,S1:根据微生物与药物关联网络、微生物与微生物相似性网络以及药物与药物相似性网络构建异构网络。S2:基于所述异构网络,利用基于图注意力网络的自编码器提取微生物和药物的拓扑特征;S3:基于所述异构网络,利用稀疏自编码器提取微生物和药物的属性特征。S4:根据节点的拓扑特征、属性特征以及节点原有的特征,分别构造微生物特征矩阵和药物特征矩阵;S5:根据微生物特征矩阵和药物特征矩阵,计算微生物

【技术实现步骤摘要】
基于图注意力的微生物与药物关联关系预测方法及系统


[0001]本专利技术涉及生物信息学和大数据
,尤其涉及基于深度学习框架的微生物与药物的关联关系预测方法及系统。

技术介绍

[0002]研究表明,人体内的微生物群不但在人类的某些生理过程中起着重要作用,例如可为人体采集或存储能量、促进人体对碳水化合物的吸收、以及保护人体免受外来微生物和病原体的侵害等,而且微生物群的组成变化还将对人体健康有重要影响。
[0003]作为新的药物靶标,微生物与药物之间有着密切的关系,不仅微生物的代谢可以显著地影响临床对药物的反应,而且药物的给药也可以类似地影响微生物组。为了进一步研究微生物和药物之间的关联关系,人们先后建立一系列的微生物和药物关联数据库,基于这些数据库,研究人员提出了大量预测模型和方法来预测微生物和药物之间的潜在关联。
[0004]深入了解微生物和药物之间的关系,不但可以加深对微生物

药物相互作用机制的理解,还可以促进微生物衍生疗法和药物研发。然而传统的实验方法检测微生物和药物之间的关联大多为湿实验,例如:独立培养法和定量法。这需要很长且密集的时间来观察,从而导致了用生物技术上确认微生物和药物之间的关联耗时长、成本高等缺点,因此,通过计算方法来预测发掘潜在的微生物和药物之间关联变得越来越重要。

技术实现思路

[0005]本专利技术目的在于提供基于图注意力的微生物与药物关联关系预测方法及系统,以解决生物实验方法预测微生物与药物关联关系实验耗时长、成本高的技术问题。/>[0006]为实现上述目的本专利技术提供基于图注意力的微生物与药物关联关系预测方法及系统,包括以下步骤,
[0007]S1:根据微生物与药物关联网络、微生物与微生物相似性网络以及药物与药物相似性网络构建异构网络,包括从MDAD数据库中下载1373种药物和 173种微生物的2470条微生物

药物关联数据,根据微生物

药物关联网络计算微生物

微生物之间的第一相似性和,第二相似性并构建微生物相似性网络,根据微生物

药物关联网络来计算药物

药物之间的第一相似性和第二相似性并构建药物相似性网络,基于所述的微生物相似性网络、所述药物相似性网络和微生物

药物关联网络,构异构网络;令表示下载得到的微生物种类集合,表示下载得到的药物种类集合,n
m
表示微生物的种类数目,n
r
表示药物的种类数目;
[0008]S2:基于所述异构网络,利用基于图注意力网络的自编码器提取微生物和药物的拓扑特征;
[0009]S3:基于所述异构网络,利用稀疏自编码器提取微生物和药物的属性特征,包括
S301:根据药物相似性以及药物和疾病关联关系构造药物属性特征矩阵;S302:根据微生物相似性以及微生物和疾病关联关系构造微生物属性特征矩阵;S303:将步骤S301和步骤S302的两个属性特征矩阵分别作为稀疏自编码器的输入,进而学习微生物和药物的属性特征表示;
[0010]S4:根据节点的拓扑特征、属性特征以及节点原有的特征,分别构造微生物特征矩阵和药物特征矩阵;
[0011]S5:根据微生物特征矩阵和药物特征矩阵,计算微生物

药物节点对的潜在关联分数。
[0012]进一步的,步骤S1包括以下步骤,
[0013]采用如下公式构建异构网络:
[0014]整合第一相似性和第二相似性来构建微生物相似性网络,两个微生物 {m
i
,m
j
}∈M之间的相似性S
m
定义如下:
[0015][0016]其中,为微生物m
i
和微生物m
j
之间的第一相似性,其计算公式如下:
[0017][0018][0019]其中,A(m
i
)和A(m
j
)分别代表邻接矩阵A的第i和第j列,||
·
||2表示L2范数,n
m
表示微生物的数量;邻接矩阵A的构造方法如下:对任意给定的药物r
i
和微生物m
j
,若它们之间存在已知的关联关系,则定义A
ij
=1,否则定义A
ij
=0;
[0020]勾微生物m
i
和微生物m
j
之间的第二相似性,其计算公式如下:
[0021][0022]其中|
·
|表示计算该向量中元素个数;
[0023]药物相似性网络通过药物第一相似性和第二相似性构建,两个药物 {r
i
,r
j
}∈R之间的相似性S
r
定义如下:
[0024][0025]其中,为药物r
i
和药物r
j
之间的第一相似性,其计算公式如下:
[0026][0027][0028]其中,A(r
i
)代表邻接矩阵A的第i行,n
r
表示药物的数量;
[0029]是药物r
i
和药物r
j
之间的第二相似性,其计算公式如下:
[0030][0031]构建一个新的邻接矩阵如下:
[0032][0033]进一步的,步骤S2包括,
[0034]将步骤S1得到的邻接矩阵作为模型的输入,定义的GAT 公式如下:
[0035][0036]其中,
[0037][0038][0039]e
ij
=LeakyRelu(α[Wh
i
||Wh
j
])
[0040][0041]这里,h
i
代表节点i的特征表示,N
i
表示异构网络中节点i的邻居节点的集合,W表示可训练的权重矩阵,||表示拼接操作,μ为超参数;
[0042]将N作为GAT的输入进行训练学习之后,由GAT的输出得到药物拓扑特征表示矩阵Z
r
和微生物拓扑特征表示矩阵Z
m

[0043]进一步的,步骤S3包括,
[0044]步骤S301中的药物属性特征矩阵A
r
的构建,采用如下公式计算:
[0045][0046]其中,为使用SIMCOMP2工具,基于药物的分子结构信息计算得到的药物结构相似性,为在S
r
上实施重启随机游走算法得到的药物相似性矩阵,重启随机游走算法的定义如下:
[0047][0048][0049]其中,M表示转移概率矩阵,ε
i
表示节点i的初始概率向量,表示节点 i在l时刻到达其它节点的概率向量;
[0050]表示基于药物

疾病关联的药物余弦相似性,的计算公式如下:...

【技术保护点】

【技术特征摘要】
1.基于图注意力的微生物与药物关联关系预测方法,包括以下步骤,S1:根据微生物与药物关联网络、微生物与微生物相似性网络以及药物与药物相似性网络构建异构网络,包括从MDAD数据库中下载1373种药物和173种微生物的2470条微生物

药物关联数据,根据微生物

药物关联网络计算微生物

微生物之间的第一相似性和,第二相似性并构建微生物相似性网络,根据微生物

药物关联网络来计算药物

药物之间的第一相似性和第二相似性并构建药物相似性网络,基于所述的微生物相似性网络、所述药物相似性网络和微生物

药物关联网络,构异构网络;令表示下载得到的微生物种类集合,表示下载得到的药物种类集合,n
m
表示微生物的种类数目,n
r
表示药物的种类数目;S2:基于所述异构网络,利用基于图注意力网络的自编码器提取微生物和药物的拓扑特征;S3:基于所述异构网络,利用稀疏自编码器提取微生物和药物的属性特征,包括S301:根据药物相似性以及药物和疾病关联关系构造药物属性特征矩阵;S302:根据微生物相似性以及微生物和疾病关联关系构造微生物属性特征矩阵;S303:将步骤S301和步骤S302的两个属性特征矩阵分别作为稀疏自编码器的输入,进而学习微生物和药物的属性特征表示;S4:根据节点的拓扑特征、属性特征以及节点原有的特征,分别构造微生物特征矩阵和药物特征矩阵;S5:根据微生物特征矩阵和药物特征矩阵,计算微生物

药物节点对的潜在关联分数。2.如权利要求1所述的基于图注意力的微生物与药物关联关系预测方法,其特征在于,步骤S1包括以下步骤,采用如下公式构建异构网络:整合第一相似性和第二相似性来构建微生物相似性网络,两个微生物{m
i
,m
j
}∈m之间的相似性S
m
定义如下:其中,为微生物m
i
和微生物m
j
之间的第一相似性,其计算公式如下:之间的第一相似性,其计算公式如下:其中,A(m
i
)和A(m
j
)分别代表邻接矩阵A的第i和第j列,||
·
||2表示L2范数,n
m
表示微生物的数量;邻接矩阵A的构造方法如下:对任意给定的药物r
i
和微生物m
j
,若它们之间存在已知的关联关系,则定义A
ij
=1,否则定义A
ij
=0;为微生物m
i
和微生物m
j
之间的第二相似性,其计算公式如下:
其中|
·
|表示计算该向量中元素个数;药物相似性网络通过药物第一相似性和第二相似性构建,两个药物{r
i
,r
j
}∈R之间的相似性S
r
定义如下:其中,为药物r
i
和药物r
j
之间的第一相似性,其计算公式如下:之间的第一相似性,其计算公式如下:其中,A(r
i
)代表邻接矩阵A的第i行,n
r
表示药物的数量;是药物r
i
和药物r
j
之间的第二相似性,其计算公式如下:构建一个新的邻接矩阵如下:3.如权利要求1所述的基于图注意力的微生物与药物关联关系预测方法,其特征在于,步骤S2包括,将步骤S1得到的邻接矩阵作为模型的输入,定义的GAT公式如下:其中,其中,e
ij
=LeakyRelu(α[Wh
i
||Wh
j
])这里,h
i
代表节点i的特征表示,N
i
表示异构网络中节点i的邻居节点的集合,W表示可训练的权重矩阵,||表示拼接操作,μ为超参数;将N作为GAT的输入进行训练学习之后,由GAT的输出得到药物拓扑特征表示矩阵Z
r
和微
生物拓扑特征表示矩阵Z
m
。4.如权利要求1所述的基于图注意力的微生物与药物关联关系预测方法,其特征在于,步骤S3包括,步骤S301中的药物属性特征矩阵A
r
的构建,采用如下公式计算:其中,为使用SIMCOMP2工具,基于药物的分子结构信息...

【专利技术属性】
技术研发人员:陈起家伍偶香刘黎利曾彬
申请(专利权)人:湖南电子科技职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1