【技术实现步骤摘要】
本专利技术属于分子式检索,涉及基于图相似度计算的分子式检索技术,具体涉及一种基于上下文依赖注意力和深度图神经网络模型计算衡量图相似度的常用指标图编辑距离的分子式检索方法。
技术介绍
1、图是通过节点和边表示实际场景中复杂关系的强大工具,在各种现实应用中无处不在,包括生物信息学、计算机图形学、推荐系统和社交网络分析等。将分子视为图并根据其相似度可实现分子式检索,该技术在药学、生物、化学等领域都有着广泛的应用。其中,图编辑距离(ged)是一种常用的图相似性度量方法,可以度量不同分子间的相似性,并据此筛选相似的分子。但图编辑距离是一个np完全问题,现有求解方法还有很大的局限性。
2、针对分子式检索任务,现有的图相似度计算方法可分为两类,一类是传统的解算器,如beam、hungarian、a*和vj等,这些旨在计算精确或近似精确的相似度,计算代价高,且难以充分利用图中隐藏的丰富特征信息,因此,很难推广到大规模分子图;另一类方法结合了最新的深度学习模型,特别是图神经网络(gnn),来计算分子图相似度,如simgnn,graphsim,
...【技术保护点】
1.一种基于上下文注意力的图相似度计算的分子式检索方法,其特征是,
2.如权利要求1所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,构建计算分子图相似度的图神经网络学习模型包括:
3.如权利要求2所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,将待计算相似度的分子式表示为分子图结构,具体是:将分子包含的原子作为节点,分子原子之间的化学键作为边,得到两个分子抽象表示成的分子图GA=(VA,EA)和GB=(VB,EB)结构;其中VA和VB是两个分子图的节点即分子包含的原子集合,EA和EB是两个分子图的边集合,即原子之间的
...【技术特征摘要】
1.一种基于上下文注意力的图相似度计算的分子式检索方法,其特征是,
2.如权利要求1所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,构建计算分子图相似度的图神经网络学习模型包括:
3.如权利要求2所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,将待计算相似度的分子式表示为分子图结构,具体是:将分子包含的原子作为节点,分子原子之间的化学键作为边,得到两个分子抽象表示成的分子图ga=(va,ea)和gb=(vb,eb)结构;其中va和vb是两个分子图的节点即分子包含的原子集合,ea和eb是两个分子图的边集合,即原子之间的化学键集合;模型的输入是两个待计算相似度的分子。
4.如权利要求3所述基于上下文注意力的图相似度计算的分子式检索方法,其特征是,通过模型的节点特征模块,采用谱域编码策略将谱域拓扑信息融合到节点特征中,得到有区分度的节点特征;进一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。