System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 结合图神经网络和对比学习的药物-靶点预测方法及系统技术方案_技高网

结合图神经网络和对比学习的药物-靶点预测方法及系统技术方案

技术编号:40512463 阅读:4 留言:0更新日期:2024-03-01 13:28
本发明专利技术公开了结合图神经网络和对比学习的药物‑靶点预测方法及系统,本发明专利技术不仅考虑了药物蛋白质的宏观信息和微观信息,还通过构建药物蛋白质对的语义图来捕获药物和蛋白质之间全面而深刻的关系,最后通过一种对比学习方法来进行邻居对比损失的学习,因为对比学习作为一种优秀的判别式模型,着重于学习同类实例之间的共同特征,区分非同类实例之间的不同之处。与生成式学习比较,对比式学习不需要关注实例上繁琐的细节,只需要在抽象语义级别的特征空间上学会对数据的区分即可,因此模型以及其优化变得更加简单,且泛化能力更强。

【技术实现步骤摘要】

本专利技术涉及药物研发与人工智能结合的,特别是涉及结合图神经网络和对比学习的药物-靶点预测方法及系统


技术介绍

1、药物靶点相互作用的鉴定(dti)在药物开发的各种应用中起着至关重要的作用。然而,传统的dti检测生物实验通常是昂贵和耗时的。目前,最新的解决方法是基于机器学习、深度学习和网络开发了一些dti预测模型,进一步拓展了dti研究的领域和方向。这类方法不仅考虑了药物之间的关联,还考虑了靶点之间的关联,往往能获得理想的预测结果。

2、然而,在药物靶点预测的方法中,现有的基于图神经网络的方法只能从药物相关或靶点相关网络中直接连接的节点中聚集信息,这就会产生很大的局限性。一方面,无法从中捕获生物异构图中的远程依赖关系;另一方面,无法明确地建模和学习药物与靶点之间的局部相互作用。而且大多数现有的图神经网络都是以监督的方式训练的,这种方式严重依赖于大量标注的良好标签,然而在实际应用中,收集大量标记的图数据通常是资源昂贵且耗时的。


技术实现思路

1、有鉴于此,本专利技术提供了结合图神经网络和对比学习的药物-靶点预测方法及系统,以克服现有技术的局限性,捕获生物异构图中的远程依赖关系,明确地建模和学习药物与靶点之间的局部相互作用。

2、为此,本专利技术采用以下技术方案:

3、本专利技术公开了一种结合图神经网络和对比学习的药物-靶点预测方法,包括:

4、收集有关药物、蛋白质、疾病和副作用的信息,对药物、蛋白质、疾病和副作用四个实体构建用于药物蛋白质预测的异构网络;

5、通过元路径的方式结合图神经网络gcn对异构网络中药物和蛋白质宏观信息上的特征进行提取;

6、获取药物的smiles字符串和蛋白质序列,并使用图神经网络gcn分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息;

7、将药物和蛋白质各自的宏观特征、微观特征进行拼接融合,并将每个药物和蛋白质的特征通过串联的方式形成一个药物蛋白质对;

8、基于学习表征的语义相似度构建相应的药物蛋白质对的语义图;

9、通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示;

10、基于最终的特征标识,预测关联概率值,得到药物-靶点预测结果。

11、进一步地,收集有关药物、蛋白质、疾病和副作用的信息,包括:从公共数据集中收集有关药物、蛋白质、疾病和副作用的信息。

12、进一步地,获取药物的smiles字符串和蛋白质序列,包括:

13、从drugbank数据库中下载药物的smiles字符串和蛋白质序列。

14、进一步地,异构网络,包括:

15、药物-药物关系网络、药物-疾病关系网络、药物-副作用关系网络和药物-化学结构相似网络;

16、蛋白质-疾病关系网络、蛋白质-蛋白质关系网络和蛋白质-序列相似性网络;以及,药物-蛋白质相互作用网络。

17、进一步地,通过元路径的方式对异构网络中药物和蛋白质宏观信息上的特征进行提取,包括:

18、从异构网络中选取药物之间的元路径和蛋白质之间的元路径;

19、使用多层图神经网络gcn学习药物的每个元路径,生成药物的表示;

20、引入基于元路径的注意力机制,为元路径分配不同的权重,融合不同元路径下的药物表示,得到最终的药物表示;

21、使用多层图神经网络gcn学习蛋白质的每个元路径,生成蛋白质的表示;

22、引入基于元路径的注意力机制,为元路径分配不同的权重,融合不同元路径下的蛋白质表示,得到最终的蛋白质表示。

23、进一步地,分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息,包括:

24、根据每个药物的化学性质初始化每个原子节点,使用三层图神经网络gcn学习药物化合物的图形表示,在二维分子图中表示节点信息;

25、其中,使用三层图神经网络gcn学习药物化合物的图形表示,包括:通过聚合药物的化学键连接的相邻原子的相应集合来更新原子特征向量,这种传播机制自动捕获分子的子结构信息;保留节点级别的药物表示,以便随后明确学习与蛋白质片段的局部相互作用。

26、进一步地,基于学习表征的语义相似度构建相应的药物蛋白质对的语义图,包括:

27、对于每个药物蛋白质对,计算它与其他药物蛋白质对之间的语义相似度,选择最接近的前预设个药物蛋白质对节点作为其相邻节点构建语义图。

28、进一步地,通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示,包括:

29、选择了多头图注意力机制对构建的语义图生成4个具有自适应拓扑的可学习图增强视图;把不同视图中相同的节点视为正节点,把这一节点在视图内和不同视图之间的邻居节点也视为额外的正节点,其他视图内和不同视图之间的非邻居节点视为负节点,具体来说,选择其中一个视图中的一个节点作为锚点,正对节点来自三个方面,锚点在其他视图中的同一节点、锚点在视图内的邻居节点以及锚点在其他视图中的邻居节点,此外其他节点都为负对节点;

30、通过最小化对比学习的损失来最大化正对节点之间的一致性,最小化负对样本之间的一致性,每个节点的嵌入特征将被迫与另一个视图中的自身以及视图内和视图间的相邻节点的嵌入特征一致,相反,每个节点的嵌入特征与视图内和跨视图的非相邻节点的嵌入特征区分开来;

31、将生成的4个图增强视图的嵌入特征拼接起来,作为药物蛋白质对输出向量,然后将它们输入到一个多层感知机中进行预测,获得计算预测结果;

32、通过交叉熵损失、对比学习得到的损失和l2正则化项计算真实值和预测值之间的损失,进一步优化模型内部的参数。

33、本专利技术还公开了一种结合图神经网络和对比学习的药物-靶点预测系统,包括:

34、异构网络构建模块,用于收集有关药物、蛋白质、疾病和副作用的信息,对药物、蛋白质、疾病和副作用四个实体构建用于药物蛋白质预测的异构网络;

35、宏观特征提取模块,用于通过元路径的方式结合图神经网络gcn对异构网络中药物和蛋白质宏观信息上的特征进行提取;

36、微观信息获取模块,用于获取药物的smiles字符串和蛋白质序列,并使用图神经网络gcn分别从药物的smiles字符串和蛋白质序列中提取各自的微观信息;

37、特征融合模块,用于将药物和蛋白质各自的宏观特征、微观特征进行拼接融合,并将每个药物和蛋白质的特征通过串联的方式形成一个药物蛋白质对;

38、语义图构建模块,用于基于学习表征的语义相似度构建相应的药物蛋白质对的语义图;

39、对比学习模块,用于通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示;

40、预测模块,用于基于最终的特征标识,预测关联概率值,得到药物-靶点预测结果。

41、本专利技术的优点和积极效果:

本文档来自技高网...

【技术保护点】

1.一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,包括:

2.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,收集有关药物、蛋白质、疾病和副作用的信息,包括:从公共数据集中收集有关药物、蛋白质、疾病和副作用的信息。

3.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,获取药物的SMILES字符串和蛋白质序列,包括:

4.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,异构网络,包括:

5.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,通过元路径的方式结合图神经网络GCN对异构网络中药物和蛋白质宏观信息上的特征进行提取,包括:

6.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,分别从药物的SMILES字符串和蛋白质序列中提取各自的微观信息,包括:

7.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,基于学习表征的语义相似度构建相应的药物蛋白质对的语义图,包括:

8.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,通过对比学习得到节点与节点之间的邻居对比损失,并获得最终的特征表示,包括:

9.一种结合图神经网络和对比学习的药物-靶点预测系统,其特征在于,包括:

...

【技术特征摘要】

1.一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,包括:

2.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,收集有关药物、蛋白质、疾病和副作用的信息,包括:从公共数据集中收集有关药物、蛋白质、疾病和副作用的信息。

3.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,获取药物的smiles字符串和蛋白质序列,包括:

4.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,异构网络,包括:

5.根据权利要求1的一种结合图神经网络和对比学习的药物-靶点预测方法,其特征在于,通过元路径的方式结合图神...

【专利技术属性】
技术研发人员:宁乔吴鸣
申请(专利权)人:大连海事大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1