基于通用的分子图表示学习模型的逆合成预测方法及装置制造方法及图纸

技术编号:39934983 阅读:20 留言:0更新日期:2024-01-08 22:06
基于通用的分子图表示学习模型的逆合成预测方法及装置,该方法将图的结构、节点特征和边特征输入基于图神经网络的分子图表示学习模型,计算得到所有产物的原子和键的特征表示向量;通过预测层预测所有产物每个原子和键应用每个局部反应模板的概率评分;将目标产物的分子图输入到最终的分子图表示学习模型中,获得目标产物的原子和键应用局部反应模板的评分,获得前top‑k对应的反应类型、反应中心位置、模板id和发生反应概率;根据评分对应的模板id从模板库中提取反应模板,将反应模板应用于产物,获得预测的反应物。本发明专利技术通过逆合成的通用分子图表示学习模型,增强在基于图的逆合成预测中对分子图的表征能力,提高逆合成预测准确率。

【技术实现步骤摘要】

本专利技术涉及一种基于通用的分子图表示学习模型的逆合成预测方法及装置,属于逆合成预测。


技术介绍

1、在实际的生产环境中,化学家们通常致力于为目标分子设计合理的合成路线。目前,一种常见的策略是将目标分子分解为更简单的前体,直到可购买化合物的迭代过程,即逆合成分析。但是,逆合成分析依靠化学家们累积的经验,设计合成路线不仅需要大量的人力和时间,且不同化学家的经验知识存在偏向性,不一定能够设计出最优合成路线。因此,使用深度学习自动化这一过程对于发现和优化合成路线至关重要。

2、传统技术中,基于深度学习的逆合成方法主要分为基于序列的方法和基于图的方法。基于序列的方法通常使用翻译模型(如transformer)直接对分子的表达式进行建模,如smiles。分子结构作为一个天然的图结构,利用图学习模型建模分子图具有天然的优势,因此,基于图的方法将分子构建为图,通过在图上进行消息传递学习原子和键的特征表示。最近,也有一些方法将它们结合起来,先使用图学习模型学习图的结构信息,再将其输入到翻译模型中学习序列信息。大多数利用图的逆合成方法都使用传统的消息传递网络或图本文档来自技高网...

【技术保护点】

1.基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,包括:

2.根据权利要求1所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,对训练集、验证集和测试集中的所有产物生成分子图的方式为:

3.根据权利要求1所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,所述分子图表示学习模型的构建过程中:

4.根据权利要求3所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,根据所述局部反应模板生成所述训练集、所述验证集和所述测试集中所有反应的训练标签的步骤包括:

5.根据权利要求1所述的基于通用的分子图表...

【技术特征摘要】

1.基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,包括:

2.根据权利要求1所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,对训练集、验证集和测试集中的所有产物生成分子图的方式为:

3.根据权利要求1所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,所述分子图表示学习模型的构建过程中:

4.根据权利要求3所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,根据所述局部反应模板生成所述训练集、所述验证集和所述测试集中所有反应的训练标签的步骤包括:

5.根据权利要求1所述的基于通用的分子图表示学习模型的逆合成预测方法,其特征在于,所述预测层根据节点和边的全局表示,获得每个原子和键应用局部反应模板的概率评分;

6.根据权利要求1所述的基于通用...

【专利技术属性】
技术研发人员:李中伟肖瑞祝艺玮却立勇鲍雨
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1