基于经验网络的蒙特卡洛树搜索逆合成规划方法及装置制造方法及图纸

技术编号：40998154 阅读：3 留言：0更新日期：2024-04-18 21:37

基于经验网络的蒙特卡洛树搜索逆合成规划方法及装置，该方法对收集的经验网络RVN和经验网络QVN的经验数据进行预处理，使用收集的经验网络RVN的经验数据对经验网络RVN进行训练，使用收集的经验网络QVN的经验数据对经验网络QVN训练；使用经验网络RVN和经验网络QVN的经验数据中成功路线上的反应组成优化数据集，采用优化数据集对单步数据集训练后的单步逆合成模型进行训练优化；将目标分子输入蒙特卡洛树搜索算法，使用训练完毕的经验网络RVN替换第一设定常数值，使用训练完毕的经验网络QVN替换第二设定常数值，使用优化后的单步逆合成模型，输出合成路线。本发明专利技术成功率和效率高，具有更好的可解释性，应用能力强。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种基于经验网络的蒙特卡洛树搜索逆合成规划方法及装置，属于有机反应产物逆合成分析。

技术介绍

1、目前，有机反应产物逆合成的目标是设计一条通过一组现实中可购买分子，经过多次化学反应最终生成目标分子的反应路线。有机反应产物逆合成主要由单步逆合成模型和多步搜索算法组成，单步逆合成模型用于预测一次反应可以合成某产物的反应物，多步搜索算法用于从单步逆合成模型预测的大量反应中快速找到一条可行的反应路线。

2、现阶段，单步逆合成模型预测的大量反应造成了巨大的搜索空间，如何快速从中找到可行的反应路线是一个极具挑战的问题。随着深度学习的发展，基于深度神经网络的多步搜索算法取得了很大成功，如retro*、eg-mcts等。这些方法利用深度神经网络学习有限的化学知识和经验数据，以此来指导多步路线的搜索。然而，这些方法的搜索效率和成功率仍有待提高，且具有可解释性差的缺点。

技术实现思路

1、为此，本专利技术提供一种基于经验网络的蒙特卡洛树搜索逆合成规划方法及装置，以提高多步搜索算法的成功率和搜索效率，并解决现有方案可解释性差的技术问题。

2、为了实现上述目的，本专利技术提供如下技术方案：基于经验网络的蒙特卡洛树搜索逆合成规划方法，包括：

3、构造单步逆合成模型，所述单步逆合成模型的目标是输入指定分子，预测通过一步反应合成所述指定分子的反应物，并使用预处理后的单步数据集训练所述单步逆合成模型；

4、构造经验网络rvn和经验网络qvn，通过所述经

5、构造蒙特卡洛树搜索算法，所述蒙特卡洛树搜索算法从根节点开始，根据所述经验网络rvn和所述经验网络qvn的预测得分沿树结构向下选择所述单步逆合成模型预测的反应节点，直至反应物构成的叶子节点，使用所述单步逆合成模型对叶子节点扩展，然后进行回溯至根节点，重复执行所述蒙特卡洛树搜索算法直至出现叶子节点均为市售分子的路线或达到搜索次数限制为止，将得到的叶子节点均为市售分子的路线作为目标分子的合成路线；

6、使用第一设定常数值代替所述经验网络rvn预测值，使用第二设定常数值代替所述经验网络qvn预测值；将预处理后的多步数据集中的目标分子依次输入所述蒙特卡洛树搜索算法中搜索目标分子的合成路线，从搜索树上分别收集所述经验网络rvn和所述经验网络qvn的经验数据；

7、对收集的所述经验网络rvn和所述经验网络qvn的经验数据进行预处理，使用收集的所述经验网络rvn的经验数据对所述经验网络rvn进行训练，使用收集的所述经验网络qvn的经验数据对所述经验网络qvn进行训练；

8、使用所述经验网络rvn和所述经验网络qvn的经验数据中成功路线上的反应组成优化数据集，采用所述优化数据集对单步数据集训练后的所述单步逆合成模型进行训练优化；

9、将目标分子输入所述蒙特卡洛树搜索算法，所述蒙特卡洛树搜索算法使用训练完毕的所述经验网络rvn替换所述第一设定常数值，使用训练完毕的所述经验网络qvn替换所述第二设定常数值，使用优化后的所述单步逆合成模型，输出由一组反应组成的合成路线。

10、作为基于经验网络的蒙特卡洛树搜索逆合成规划方法优选方案，还包括处理所述单步数据集，所述单步数据集以uspto作为原始数据集，由smiles表达的化学反应组成；

11、使用rdkit工具包对所述单步数据集不符合预设规则的反应进行过滤，使用rxnmapper工具包对过滤后的反应进行原子映射，按照设定比例随机将所述单步数据集划分为训练集、验证集和测试集；使用rdchiral从所述单步数据集中提取逆反应模板，获得逆反应模板库，将逆反应模板与所述单步数据集的反应进行匹配，获得训练标签。

12、作为基于经验网络的蒙特卡洛树搜索逆合成规划方法优选方案，还包括处理所述多步数据集，所述多步数据集以uspto作为原始数据集，由一组smiles表达的化学反应组成一条多步反应路线；

13、使用rdkit工具包对所述多步数据集不符合预设规则的反应进行过滤，若反应路线中存在不符合预设规则的反应路线，则过滤不符合预设规则的反应路线，遍历反应路线中所有的末端反应物分子，如果反应物非市售分子，则过滤对应的反应路线，提取反应路线终端的目标分子，组成目标分子库。

14、作为基于经验网络的蒙特卡洛树搜索逆合成规划方法优选方案，所述单步逆合成模型的表达公式为：

15、；

16、式中，和表示非线性激活函数，和为模型的参数矩阵，和为偏置向量；为使用rdkit工具包生成的产物摩根指纹转化的特征向量。

17、作为基于经验网络的蒙特卡洛树搜索逆合成规划方法优选方案，所述经验网络rvn和所述经验网络qvn的输入是反应的摩根指纹转化的特征向量，使用rdkit工具包分别生成产物的摩根指纹转化的特征向量，及反应物的摩根指纹转化的特征向量{}，反应的摩根指纹表示为产物的摩根指纹减反应物摩根指纹的和，公式为：

18、；

19、式中，表示反应物的数量；

20、将反应的摩根指纹转化的特征向量输入所述经验网络rvn，经过两层mlp和sigmoid激活函数，获得一个常数值，表示反应产生成功规划反应路线的概率值，反应产生成功规划反应路线的概率值的表达公式为：

21、；

22、式中，表示搜索过程中的反应节点，和为模型的参数矩阵，和为偏执向量；

23、将反应的摩根指纹转化的特征向量输入所述经验网络qvn，经过两层mlp和softplus激活函数，获得一个常数值，表示合成该反应的反应物的反应路线长度，合成该反应的反应物的反应路线长度的表达公式为：

24、；

25、式中，和为模型的参数矩阵，和为偏执向量。

26、作为基于经验网络的蒙特卡洛树搜索逆合成规划方法优选方案，所述蒙特卡洛树搜索算法的搜索结果使用and-or树结构表示，and-or树包括and节点和or节点，and节点表示反应节点，or节点表示分子节点，根节点为目标分子的or节点，and节点的父节点为对应反应产物的or节点，孩子节点为对应反应的反应物的or节点；

27、所述蒙特卡洛树搜索算法的搜索过程中，or节点包含一个分子、表示分子可合成性的以及表示分子合成成本的，and节点包含一个反应模板、表示反应产生成功规划反应路线的概率值、表示合成指定反应的反应物的反应路线长度和单步逆合成模型的预测值；

28、当and节点的子节全部成功时，and节点标记为成功，当and节点的子节点存在成功的节点时，or节点标记为成功；当or节点的分子是市售分子时，or节点标记为成功，当一条反应路线上的所有叶节点的反应物都是市售分子时则找到一条成功的逆合成路线；

29、如果or节点的分子通过所述单步逆合成模型不能预测出合理反应，则将对应o本文档来自技高网...

【技术保护点】

1.基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，包括：

2.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，还包括处理所述单步数据集，所述单步数据集以USPTO作为原始数据集，由SMILES表达的化学反应组成；

3.根据权利要求2所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，还包括处理所述多步数据集，所述多步数据集以USPTO作为原始数据集，由一组SMILES表达的化学反应组成一条多步反应路线；

4.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述单步逆合成模型的表达公式为：

5.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述经验网络RVN和所述经验网络QVN的输入是反应的摩根指纹转化的特征向量，使用RDKit工具包分别生成产物的摩根指纹转化的特征向量，及反应物的摩根指纹转化的特征向量{}，反应的摩根指纹表示为产物的摩根指纹减反应物摩根指纹的和，公式为：

6.根据权利要求5所述的基于经验网络的蒙特卡

7.根据权利要求6所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述蒙特卡洛树搜索算法中，从根节点开始，从根节点的子节点中选择最优的反应节点，反应节点的选择根据经验值和计算综合值，选择综合值最大的反应节点：

8.根据权利要求7所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述蒙特卡洛树搜索算法中，通过所述单步逆合成模型预测所选分子可能匹配的个模板，应用个模板获得反应物，分别将个模板和反应物分子构造AND节点和OR节点，加入AND-OR树中；

9.根据权利要求8所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述蒙特卡洛树搜索算法中，对于反应节点，根据反应节点的子节点更新后的和，获得新的和值，更新为所有子节点的乘积，更新为所有子节点的和，根据访问次数取均值获得更新后的和；并将反应节点的访问次数加1；

10.基于经验网络的蒙特卡洛树搜索逆合成规划装置，采用权利要求1至9任一项所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，包括：

...

【技术特征摘要】

1.基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，包括：

2.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，还包括处理所述单步数据集，所述单步数据集以uspto作为原始数据集，由smiles表达的化学反应组成；

3.根据权利要求2所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，还包括处理所述多步数据集，所述多步数据集以uspto作为原始数据集，由一组smiles表达的化学反应组成一条多步反应路线；

4.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述单步逆合成模型的表达公式为：

5.根据权利要求1所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述经验网络rvn和所述经验网络qvn的输入是反应的摩根指纹转化的特征向量，使用rdkit工具包分别生成产物的摩根指纹转化的特征向量，及反应物的摩根指纹转化的特征向量{}，反应的摩根指纹表示为产物的摩根指纹减反应物摩根指纹的和，公式为：

6.根据权利要求5所述的基于经验网络的蒙特卡洛树搜索逆合成规划方法，其特征在于，所述蒙特卡洛树搜索算法的搜索结果使用and-or树结构表示，and-or树包括and节...

【专利技术属性】
技术研发人员：李中伟，肖瑞，祝艺玮，柳彦宏，
申请(专利权)人：烟台国工智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人