当前位置: 首页 > 专利查询>北京大学专利>正文

基于上下文注意力的图相似度计算的分子式检索方法技术

技术编号:41762504 阅读:33 留言:0更新日期:2024-06-21 21:42
本发明专利技术公布了一种基于上下文注意力的图相似度计算的分子式检索方法,基于上下文依赖注意力机制和图神经网络模型构建计算分子图相似度的图神经网络学习模型,用于计算分子图相似度;将两个待计算相似度的分子图输入到构建的模型;学习有效的分子图节点特征,获得分子图间交互特征并增强分子图内嵌入特征;使用谱域编码补充拓扑信息,将分子图的节点特征池化至分子图的整体特征;再对原始分子图对的相似度进行预测;通过分子图的相似度计算实现分子式检索。采用本发明专利技术的技术方案,能够有效提升分子式检索的精度。

【技术实现步骤摘要】

本专利技术属于分子式检索,涉及基于图相似度计算的分子式检索技术,具体涉及一种基于上下文依赖注意力和深度图神经网络模型计算衡量图相似度的常用指标图编辑距离的分子式检索方法。


技术介绍

1、图是通过节点和边表示实际场景中复杂关系的强大工具,在各种现实应用中无处不在,包括生物信息学、计算机图形学、推荐系统和社交网络分析等。将分子视为图并根据其相似度可实现分子式检索,该技术在药学、生物、化学等领域都有着广泛的应用。其中,图编辑距离(ged)是一种常用的图相似性度量方法,可以度量不同分子间的相似性,并据此筛选相似的分子。但图编辑距离是一个np完全问题,现有求解方法还有很大的局限性。

2、针对分子式检索任务,现有的图相似度计算方法可分为两类,一类是传统的解算器,如beam、hungarian、a*和vj等,这些旨在计算精确或近似精确的相似度,计算代价高,且难以充分利用图中隐藏的丰富特征信息,因此,很难推广到大规模分子图;另一类方法结合了最新的深度学习模型,特别是图神经网络(gnn),来计算分子图相似度,如simgnn,graphsim,gmn等,具可扩展性本文档来自技高网...

【技术保护点】

1.一种基于上下文注意力的图相似度计算的分子式检索方法,其特征是,

2.如权利要求1所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,构建计算分子图相似度的图神经网络学习模型包括:

3.如权利要求2所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,将待计算相似度的分子式表示为分子图结构,具体是:将分子包含的原子作为节点,分子原子之间的化学键作为边,得到两个分子抽象表示成的分子图GA=(VA,EA)和GB=(VB,EB)结构;其中VA和VB是两个分子图的节点即分子包含的原子集合,EA和EB是两个分子图的边集合,即原子之间的化学键集合;模型的输...

【技术特征摘要】

1.一种基于上下文注意力的图相似度计算的分子式检索方法,其特征是,

2.如权利要求1所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,构建计算分子图相似度的图神经网络学习模型包括:

3.如权利要求2所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,将待计算相似度的分子式表示为分子图结构,具体是:将分子包含的原子作为节点,分子原子之间的化学键作为边,得到两个分子抽象表示成的分子图ga=(va,ea)和gb=(vb,eb)结构;其中va和vb是两个分子图的节点即分子包含的原子集合,ea和eb是两个分子图的边集合,即原子之间的化学键集合;模型的输入是两个待计算相似度的分子。

4.如权利要求3所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,通过模型的节点特征模块,采用谱域编码策略将谱域拓扑信息融合到节点特征中,得到有区分度的节点特征;进一...

【专利技术属性】
技术研发人员:吕肖庆贾瑞琪冯贤兵
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1