基于图卷积网络的微生物与疾病关联关系预测方法与系统技术方案

技术编号:36751168 阅读:16 留言:0更新日期:2023-03-04 10:38
本发明专利技术提供基于图卷积网络的微生物与疾病关联关系预测方法,包括以下步骤:S1:根据微生物与疾病关联网络、微生物与微生物相似性网络以及疾病与疾病相似性网络构建异构网络S2:基于步骤S1构建的异构网络,采用图卷积神经网络分别提取微生物和疾病各层的嵌入特征;S3:采用图卷积神经网络导出的多层注意机制将每一层得到的嵌入特征融合在一起;S4:采用双线性解码器推断得到微生物

【技术实现步骤摘要】
基于图卷积网络的微生物与疾病关联关系预测方法与系统


[0001]本专利技术涉及生物信息学和大数据
,尤其涉及基于深度学习框架的基于图卷积网络的微生物与疾病关联关系预测方法及系统。

技术介绍

[0002]研究表明,人体内的微生物群不但在人类的某些生理过程中起着重要作用,例如可为人体采集或存储能量、促进人体对碳水化合物的吸收、以及保护人体免受外来微生物和病原体的侵害等,而且微生物群的组成变化还将对人体健康有重要影响。
[0003]微生物和疾病之间密不可分的关系吸引了科学家们开展许多项目来调查研究微生物和疾病之间的关联,例如人类微生物组工程和地球微生物群工程,旨在深入了解微生物组成及其在人类疾病中的重要作用和建立一个地球微生物多样性的全球目录。另外,为了进一步研究微生物和疾病之间的关联关系,人们先后建立一系列的微生物和疾病关联数据库,基于这些数据库,研究人员提出了大量预测模型和方法来预测微生物和疾病之间的潜在关联。
[0004]深入了解微生物和疾病之间的关系,不但可以揭露更多人类疾病的发病机制,而且能对疾病的预防、治疗和诊断提供帮助。然而传统的实验方法检测微生物和疾病之间的关联大多为湿实验,例如:独立培养法和定量法。这需要很长且密集的时间来观察,另外,由于疾病种类的多样性,难以验证涉及不同疾病的某些宿主和微生物之间的相互作用是偶然的还是必然的。这就导致了用生物技术上确认微生物和疾病之间的关联耗时长、成本高和具有盲目性等缺点,因此,通过计算方法来预测发掘潜在的微生物和疾病之间关联变得越来越重要。
>
技术实现思路

[0005]本专利技术目的在于提供微生物与疾病关联关系预测方法,以解决生物实验方法预测微生物与疾病关联关系实验耗时长、成本高和具有盲目性的技术问题。
[0006]为实现上述目的本专利技术提供基于图卷积网络的微生物与疾病关联关系预测方法,包括以下步骤:
[0007]S1:根据微生物与疾病关联网络、微生物与微生物相似性网络以及疾病与疾病相似性网络构建异构网络,包括,S101:从HMDAD数据库中下载微生物

疾病关联关系数据,其中包括39种疾病和292种微生物之间的483种实验关联通过重复数据消除操作,从HMDAD导出了450个关联,涉及39种疾病和292种微生物;令表示下载得到的微生物种类集合,微生物种类集合,表示下载得到的疾病种类集合,得到邻接矩阵对于m
i
(1≤i≤N
m
)和d
j
(1≤j≤N
d
),若它们之间存在关联则令A
i,j
=1,否则A
i,j
=0;,N
m
表示微生物种类的个数,N
d
表示疾病种类的个数。
[0008]S102:根据微生物

疾病关联网络计算微生物

微生物之间的第一相似性和第二相
似性并构建微生物相似性网络;
[0009]S103:根据微生物

疾病关联网络来计算疾病

疾病之间的第一相似性和第二相似性来构建疾病相似性网络;
[0010]S104:基于上述得到的微生物相似性网络、疾病相似性网络和微生物

疾病关联网络,构建一个异构网络;
[0011]S2:基于步骤S1构建的异构网络,采用图卷积神经网络分别提取微生物和疾病各层的嵌入特征;
[0012]S3:采用图卷积神经网络导出的多层注意机制将每一层得到的嵌入特征融合在一起;
[0013]S4:采用双线性解码器推断得到微生物

疾病关联关系数据。
[0014]进一步的,步骤S1中异构网络的构建,采用如下公式进行计算:
[0015]整合第一相似性和第二相似性来构建微生物相似性网络,两个微生物{m
i
,m
j
}∈M之间的相似性S
m
定义如下:
[0016][0017]其中,CM(m
i
,m
j
)为微生物m
i
和微生物m
j
之间的第二相似性,其计算公式如下:
[0018][0019]其中,A(i,:)和A(j,:)分别代表邻接矩阵A的第i和第j行;KM(m
i
,m
j
)为微生物m
i
和微生物m
j
之间的第一相似性,其计算公式如下:
[0020]KM(m
i
,m
j
)=exp(

γ
m
||A(i,:)

A(j,:)||2)
[0021]其中||
·
||2表示L2范数,参数γ
m
可计算如下:
[0022][0023]疾病相似性网络通过疾病第二相似性和第一相似性构建,两个疾病{d
i
,d
j
}∈D之间的相似性S
d
定义如下:
[0024][0025]其中,CD(d
i
,d
j
)为疾病d
i
和疾病d
j
之间的第二相似性,其计算公式如下:
[0026][0027]其中,A(:,i)代表邻接矩阵A的第i列。
[0028]KD(d
i
,d
j
)是疾病d
i
和疾病d
j
之间的第一相似性,其计算公式如下:
[0029]KD(d
i
,d
j
)=exp(

γ
d
||A(:,i)

A(:,j)||2)
[0030]其中||
·
||2表示L2范数,参数γ
d
可计算如下:
[0031][0032]基于上述得到的微生物相似性矩阵疾病相似性矩阵和微生物

疾病关联关系邻接矩阵A,构建邻接矩阵如下:
[0033][0034]进一步的,其特征在于步骤S2包括,
[0035]将步骤S1得到的邻接矩阵作为模型的输入,定义的GCN公式如下:
[0036][0037]设L表示GCN的节点层数,l∈{1,...,L},H
l
代表第1层节点的嵌入特征,是第1层的权重矩阵,k是第1嵌入特征的维数,σ(
·
)代表非线性激活函数,采用以下整流线性单元ReLU作为激活函数。
[0038][0039]进一步的,所述步骤S3包括,
[0040]H0代表Y中节点的初始嵌入特征,初始化H0公式如下:
[0041][0042]得出微生物和疾病的最终嵌入特征,如下所示:
[0043][0044]代表微生物的最终的嵌入特征矩阵,代表疾本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于图卷积网络的微生物与疾病关联关系预测方法,其特征在于,包括以下步骤:S1:根据微生物与疾病关联网络、微生物与微生物相似性网络以及疾病与疾病相似性网络构建异构网络,包括,S101:从HMDAD数据库中下载微生物

疾病关联关系数据,其中包括39种疾病和292种微生物之间的483种实验关联通过重复数据消除操作,从HMDAD导出了450个关联,涉及39种疾病和292种微生物;令表示下载得到的微生物种类集合,物种类集合,表示下载得到的疾病种类集合,得到邻接矩阵对于m
i
(1≤i≤N
m
)和d
j
(1≤j≤N
d
),若它们之间存在关联则令A
i,j
=1,否则A
i,j
=0;,N
m
表示微生物种类的个数,N
d
表示疾病种类的个数。S102:根据微生物

疾病关联网络计算微生物

微生物之间的第一相似性和第二相似性并构建微生物相似性网络;S103:根据微生物

疾病关联网络来计算疾病

疾病之间的第一相似性和第二相似性来构建疾病相似性网络;S104:基于上述得到的微生物相似性网络、疾病相似性网络和微生物

疾病关联网络,构建一个异构网络;S2:基于步骤S1构建的异构网络,采用图卷积神经网络分别提取微生物和疾病各层的嵌入特征;S3:采用图卷积神经网络导出的多层注意机制将每一层得到的嵌入特征融合在一起;S4:采用双线性解码器推断得到微生物

疾病关联关系数据。2.如权利要求1所述的基于图卷积网络的微生物与疾病关联关系预测方法,其特征在于,步骤S1中异构网络的构建,采用如下公式进行计算:整合第一相似性和第二相似性来构建微生物相似性网络,两个微生物{m
i
,m
j
}∈M之间的相似性S
m
定义如下:其中,CM(m
i
,m
j
)为微生物m
i
和微生物m
j
之间的第二相似性,其计算公式如下:其中,A(i,:)和A(j,:)分别代表邻接矩阵A的第i和第j行;KM(m
i
,m
j
)为微生物m
i
和微生物m
j
之间的第一相似性,其计算公式如下:KM(m
i
,m
j
)=exp(

γ
m
||A(i,:)
‑<...

【专利技术属性】
技术研发人员:刘黎利陈起家伍偶香曾彬
申请(专利权)人:湖南电子科技职业学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1