一种基于多步预测的合成路线排序方法及装置制造方法及图纸

技术编号:43014081 阅读:34 留言:0更新日期:2024-10-18 17:18
一种基于多步预测的合成路线排序方法及装置,该方法收集已完成原子映射的反应SMILES,构建合成路线数据集;将数据集中每条合成路线的目标分子及中间体分子的断键进行标记,获得产物分子断键次序数据集;构建信息传递多标签分类神经网络模型并进行训练;将目标分子及中间体分子的断键次序输入训练好的模型;获得产物分子中每个原子及键在预测步数上的预测概率,并将其与产物分子在合成路线上的断键次序进行比对,获得每条合成路线的契合度;按照契合度的高低进行排序,获得合成路线的排序结果。本发明专利技术通过学习路线中目标分子及中间体产物的断键次序策略信息并将符合这些断键规则的生成路线推荐出来,从而提高合成路线规划的合理性。

【技术实现步骤摘要】

本专利技术涉及化合物合成分析,具体涉及一种基于多步预测的合成路线排序方法及装置


技术介绍

1、当前逆合成分析研究领域主要分单步与多步两个方向,单步逆合成方法是给定产物,推导对应反应物的方法。多步逆合成方法一般是使用mcts、retro*等各种搜索算法结合单步模型来生成多步路线。单步逆合成方法通过训练单步模型来学习反应数据集中的单步反应信息。

2、然而,目前业内很少通过直接学习合成路线数据集中的多步反应信息来指导合成路线规划,即未能提炼、学习数据集中大量的如保护、脱保护等路线规划策略信息并充分利用,导致生成的路线中包含大量不合理反应。合成路线中包含的策略信息往往存在于目标分子及其它中间体产物的断键规则中,通过学习路线中的断键次序并将符合这些断键规则的生成路线推荐出来,可大大提升合成路线的合理性。

3、因此,如何专利技术一种基于多步预测的合成路线排序方法,成为亟需解决的问题。


技术实现思路

1、为此,本专利技术提供一种基于多步预测的合成路线排序方法及装置,该方法通过学习路线中目标分子及中本文档来自技高网...

【技术保护点】

1.一种基于多步预测的合成路线排序方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多步预测的合成路线排序方法,其特征在于,所述产物分子断键次序数据集由产物SMILES及断键次序两字段构成。

3.根据权利要求2所述的一种基于多步预测的合成路线排序方法,其特征在于,所述信息传递多标签分类神经网络模型的输入为产物的图表示,输出为产物每个原子及键在每步上的预测概率;所述产物的图表示编码包括原子特征向量矩阵、键特征向量矩阵和邻接矩阵。

4.根据权利要求3所述的一种基于多步预测的合成路线排序方法,其特征在于,在通过所述训练集及所述验证集对所述信息传递多标...

【技术特征摘要】

1.一种基于多步预测的合成路线排序方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多步预测的合成路线排序方法,其特征在于,所述产物分子断键次序数据集由产物smiles及断键次序两字段构成。

3.根据权利要求2所述的一种基于多步预测的合成路线排序方法,其特征在于,所述信息传递多标签分类神经网络模型的输入为产物的图表示,输出为产物每个原子及键在每步上的预测概率;所述产物的图表示编码包括原子特征向量矩阵、键特征向量矩阵和邻接矩阵。

4.根据权利要求3所述的一种基于多步预测的合成路线排序方法,其特征在于,在通过所述训练集及所述验证集对所述信息传递多标签分类神经网络模型进行训练的过程中,采用adam优化器、二元交叉熵损失函数对所述信息传递多标签分类神经网络模型进行训练。

5.根据权利要求4所述的一种基于多步预测的合成路线排序方法,其特征在于,在通过计算获得所述合成路线数据集中每条合成路线的契合度的过程中,所述契合度的计算公式为:

6.一种基于多步预测的合成路线排序装置,采用权利要求1-5任一项所述的一种基于多步预测的合成路线排序方法,其特征在...

【专利技术属性】
技术研发人员:却立勇柳彦宏李中伟
申请(专利权)人:烟台国工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1