基于超图神经网络的药物-标靶相互作用预测方法技术

技术编号:26690764 阅读:33 留言:0更新日期:2020-12-12 02:41
本发明专利技术提供基于超图神经网络的药物‑标靶相互作用预测方法,首先从公开数据库上搜集药物‑标靶相互作用信息作为数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络,然后对异质生物网络进行建模获得异质生物超图,根据获得的异质生物超图生成其对偶超图,再利用超图神经网络进行药物、标靶特征提取,生成药物嵌入和标靶嵌入,最后计算药物和标靶之间相互作用的概率。本发明专利技术技术方案将异质生物网络建模为超图,可以充分学习药物和标靶间的高阶复杂关系,带来更好的预测效果。

【技术实现步骤摘要】
基于超图神经网络的药物-标靶相互作用预测方法
本专利技术属于计算生物学领域,尤其针对计算药物发现方法,具体涉及一种基于超图神经网络的药物-标靶相互作用预测方法。
技术介绍
药物-靶标相互作用(DTIs)的识别是开发新药和了解其副作用的重要步骤。由于开发用于靶向大量蛋白质和疾病过程的合成化合物的数量不断增加,使用生物学实验鉴定药物-靶标相互作用既耗时又昂贵,这是传统药物发现方法面临的一大困境。近年来,为了减轻这些缺点,研究人员已尝试使用计算方法来识别药物-靶标相互作用。计算方法中的深度学习方法在不同领域得到了很好的应用,如卷积神经网络应用于图像处理领域,长短期记忆网络应用于自然语言处理领域。针对不规则的图(如分子结构,社交网络等)这样的非欧数据结构时,也提出了图卷积算法以实现更好的预测性能。但是,大多数现有方法都是基于药物和目标之间的已知关联来预测新型DTIs,这些已知关联都是低阶的成对关系。实际上,一种药物会和多种标靶产生相互作用关系,反之也是如此。所以基于网络或者普通图模型的方法难以捕获药物和标靶之间的高阶复杂关系。然后,我们提出了一种新颖的基于深度学习的框架,即超图卷积网络HGNN-DTI,用于药物-靶标相互作用识别。该模型首先使用超图卷积神经网络来学习每个药物和标靶的嵌入。其次,将这些嵌入作为输入,计算相似性,生成相互作用概率矩阵。
技术实现思路
本专利技术主要考虑随着更多新药物的合成和使用以及对更多标靶的深入了解,我们愈发需要对药物进行重定位,充分利用新药物。尤其是需要计算方法来进行药物发现,以避免在湿实验室中耗时又昂贵的生物实验。提供了一种基于超图神经网络的药物-标靶相互作用预测方法,结合了超图神经网络,孪生神经网络,提高了模型的预测性能和鲁棒性。本专利技术针对多种不同类型标靶,如酶,离子通道,蛋白质偶联受体,核受体,预测其与药物间的相互作用。基于超图神经网络的药物-标靶相互作用预测方法,步骤如下:步骤1、从公开数据库上搜集药物-标靶相互作用信息作为数据集。从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络。步骤2、对异质生物网络进行建模获得异质生物超图。步骤3、根据步骤2中获得的异质生物超图G生成其对偶超图。步骤4、利用超图神经网络进行药物、标靶特征提取,生成药物嵌入和标靶嵌入。步骤5、计算药物和标靶之间相互作用的概率。步骤6、训练超图神经网络模型。步骤1具体操作如下:从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络。异质生物网络Gh={Vh,Eh}指的是包含多种类型节点和边的生物网络,其中Vh={v1,…,vM}代表节点,Eh={e1,…,eN}代表边。令O和R分别作为节点类型和边的类型的集合,其中,O={药物,标靶},R={药物-标靶相互作用}。步骤2具体操作如下:为了能够分析药物和标靶之间的相互作用,捕获它们之间的高阶复杂关系,对异质生物网络进行建模获得异质生物超图G={V={v1,…,vM},E={e1,…,eN}}。超图不同于传统图,超图中一条边不再只能够链接两个节点,而是可以链接两个以上的节点,称为超边。采用关联矩阵代表异质生物超图中药物-标靶相互作用的高阶复杂关系,即药物为超边,与药物产生相互作用的标靶为节点,所以关联矩阵Hd-t矩阵中的一列代表由一种药物确定的一条超边。如果第i个节点与第j条超边相连,即第i个标靶与第j个药物相连,那么关联矩阵Hd-t中第i行,第j列的数据点Hd-ti,j=1,否则Hd-ti,j=0。步骤3具体操作如下:异质生物超图G的对偶超图G’={V’,E’}被用来捕获异质生物网络中的标靶-药物相互作用关系,其中V’=E代表节点,E’=V代表边。对偶超图的关联矩阵为Hd-t的转置,代表了标靶-药物相互作用的高阶复杂关系。步骤4具体操作如下:超图神经网络由超图卷积层组成,被用来提取异质生物超图及其对偶超图中的高阶复杂关系以得到药物嵌入Zd和标靶嵌入Zt。其中Ddv和Dde分别是异质生物超图中代表药物-标靶相互作用的高阶复杂关系的关联矩阵Hd-t中节点和超边的度矩阵;Dtv和Dte分别是异质生物超图中代表标靶-药物相互作用的高阶复杂关系的关联矩阵Ht-d中节点和超边的度矩阵;节点的度矩阵第k行,第k列的数据点是第k个节点的度;超边的度矩阵第j行,第j列的数据点是第j条超边的度。W是可学习参数的权重矩阵,(·)T是转置操作;Xd和Xt分别是药物节点特征和标靶节点特征,分别用N×N和M×M的单位阵代替。f是非线性激活函数。步骤5具体操作如下:将由步骤4得到的药物嵌入Zd和标靶嵌入Zt相乘即可得到代表药物-标靶相互作用的概率矩阵A。其中Sigmoid是sigmoid非线性激活函数。概率矩阵中的每个元素就代表了对应药物和标靶之间产生相互作用的概率。步骤6具体操作如下:通过反向传播梯度下降来更新权重;在训练过程中通过训练集和测试集,采用五折交叉验证来调整超参数及验证模型稳定性;模型优化的损失函数为二分类交叉熵损失函数。本专利技术有益效果如下:随着医药领域的长足发展,越来越多的药物得到临床使用。但充分利用这些药物进行疾病治疗,了解其副作用仍是一大难题,传统的生物实验验证耗时费力,采用该专利技术这样的计算方法可以有效解决这一问题。现有方案都将异质生物网络建模为图,而图的局限性使得这些方案都只能捕获药物和标靶间的低阶成对关系。而本专利技术技术方案将异质生物网络建模为超图,可以充分学习药物和标靶间的高阶复杂关系,带来更好的预测效果。附图说明图1为本专利技术实施方法步骤示意图;图2为由药物和标靶组成的异质生物网络生成超图关联矩阵示意图。图3为深度神经网络结构示意图。具体实施方式下面结合具体实施方式对本专利技术进行详细的说明。如图1所示,本专利技术提出的基于深度学习的超图神经网络的药物发现方法,捕获异质生物网络中节点间的拓扑关系以进行药物-标靶相互作用预测,按照以下步骤实施。步骤1、从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,并将其分为训练集和测试集。从训练集中的数据构建由药物和标靶组成的异质生物网络。异质生物网络Gh={Vh,Eh}指的是包含多种类型节点和边的生物网络,其中Vh={v1,…,vM}代表节点,Eh={e1,…,eN}代表边。令O和R分别作为节点类型和边的类型的集合,在我们的方法中,O={药物,标靶},R={药物-标靶相互作用}。我们将获得的数据集分为训练集和测试集,利用训练集中的数据构建异质生物网络。步骤2、对异质生物网络进行建模获得异质生物超图G={V={v1,…,vM},E={e1,…,eN}}。如图2本文档来自技高网...

【技术保护点】
1.基于超图神经网络的药物-标靶相互作用预测方法,其特征在于,步骤如下:/n步骤1、从公开数据库上搜集药物-标靶相互作用信息作为数据集;/n从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络;/n步骤2、对异质生物网络进行建模获得异质生物超图;/n步骤3、根据步骤2中获得的异质生物超图G生成其对偶超图;/n步骤4、利用超图神经网络进行药物、标靶特征提取,生成药物嵌入和标靶嵌入;/n步骤5、计算药物和标靶之间相互作用的概率;/n步骤6、训练超图神经网络模型。/n

【技术特征摘要】
1.基于超图神经网络的药物-标靶相互作用预测方法,其特征在于,步骤如下:
步骤1、从公开数据库上搜集药物-标靶相互作用信息作为数据集;
从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络;
步骤2、对异质生物网络进行建模获得异质生物超图;
步骤3、根据步骤2中获得的异质生物超图G生成其对偶超图;
步骤4、利用超图神经网络进行药物、标靶特征提取,生成药物嵌入和标靶嵌入;
步骤5、计算药物和标靶之间相互作用的概率;
步骤6、训练超图神经网络模型。


2.根据权利要求1所述的基于超图神经网络的药物-标靶相互作用预测方法,其特征在于,步骤1具体如下:
从公开数据库中搜集大量的药物-标靶相互作用信息,形成数据集,将获得的数据集分为训练集和测试集,利用训练集中的数据构建用于建模的异质生物网络;异质生物网络Gh={Vh,Eh}指的是包含多种类型节点和边的生物网络,其中Vh={v1,…,vM}代表节点,Eh={e1,…,eN}代表边;令O和R分别作为节点类型和边的类型的集合,其中,O={药物,标靶},R={药物-标靶相互作用}。


3.根据权利要求2所述的基于超图神经网络的药物-标靶相互作用预测方法,其特征在于,步骤2具体如下:
为了能够分析药物和标靶之间的相互作用,捕获它们之间的高阶复杂关系,对异质生物网络进行建模获得异质生物超图G={V={v1,…,vM},E={e1,…,eN}};超图不同于传统图,超图中一条边不再只能够链接两个节点,而是可以链接两个以上的节点,称为超边;采用关联矩阵代表异质生物超图中药物-标靶相互作用的高阶复杂关系,即药物为超边,与药物产生相互作用的标靶为节点,所以关联矩阵Hd-t矩阵中的一列代表由一种药物确定的一条超边;如果第i个节点与第j条超边相连,即第i个标靶与第j个药物相连,那么关联矩阵Hd-t中第i行,第j列的数据点Hd-ti,j=1,否则Hd-ti,j=0。


4.根据权利要求3所述的基于超图神经网络的药物-标靶相互作用预测方...

【专利技术属性】
技术研发人员:颜成钢阮定孙垚棋张继勇张勇东
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1