一种合成及逆合成分子图预测模型的处理方法和装置制造方法及图纸

技术编号:38757939 阅读:14 留言:0更新日期:2023-09-10 09:42
本发明专利技术实施例涉及一种合成及逆合成分子图预测模型的处理方法和装置,所述方法包括:构建分子图预测模型;按反应物到生成物的合成预测方向对模型进行训练;并按生成物到反应物的逆合成预测方向对模型进行训练;在处理合成预测任务时,基于生成物预测模型参数对模型进行配置得到第一预测模型,并基于第一预测模型进行生成物分子图预测;在处理逆合成预测任务时,基于反应物预测模型参数对模型进行配置得到第二预测模型,并基于第二预测模型进行反应物分子图预测。通过本发明专利技术可输出带有丰富拓扑信息的二维分子图,可基于同一个模型结构处理两类预测任务。两类预测任务。两类预测任务。

【技术实现步骤摘要】
一种合成及逆合成分子图预测模型的处理方法和装置


[0001]本专利技术涉及数据处理
,特别涉及一种合成及逆合成分子图预测模型的处理方法和装置。

技术介绍

[0002]合成/逆合成预测是有机化学和药物设计中的关键任务。合成预测指给定反应物进行生成物(也叫产物)预测,逆合成则是在给定生成物的情况下对反应物进行反向预测。随着计算机辅助合成规划的兴起,人们越来越关注利用机器学习技术来推动这一过程。
[0003]传统基于机器学习的合成/逆合成预测模型大多以一维分子序列为输入输出结构,SMILES(Simplified Molecular Input Line Entry System)序列就是一种典型的一维分子序列。这种常规预测模型可以方便地使用自然语言处理(NLP)技术的现有模型来实现,如 RNN模型、LSTM模型、Transformer模型等。这种常规预测模型简单易用,但也存在一定局限性:一维序列与二维分子图不同、无法提供丰富的拓扑信息。
[0004]最近的一些研究已经给出了一些以二维分子图作为分子表达的合成/逆合成模型,这些新型的合成/逆合成模型大多基于图编辑策略实现,诸如MEGAN模型。这类模型可以输出带有丰富拓扑信息的预测图,还有助于整合产物—反应物间的原子映射对齐信息,但其计算量巨大的缺陷也使得该类模型的应用和维护成本过大。

技术实现思路

[0005]本专利技术的目的,就是针对现有技术的缺陷,提供一种合成及逆合成分子图预测模型的处理方法、装置、电子设备及计算机可读存储介质,对传统transformer模型进行改造生成一个可以根据输入的反应物/生成物分子图或输入的反应物/生成物分子图+分子图三维构象进行对应的生成物/反应物分子图预测的处理模型,并以Uni

Mol+模型作为该模型的编码器,并使解码器以自回归逐节点方式生成预测图;并通过训练使该模型能对输入、输出分子图进行原子映射对齐;并通过对该模型进行合成/逆合成训练得到对应的两组模型参数(生成物预测模型参数,反应物预测模型参数);并由该分子图预测模型在加载不同模型参数的情况下完成对应的合成/逆合成预测任务。本专利技术提供的分子图预测模型可以输出带有丰富拓扑信息的二维分子图、可以对输入/输出分子图进行原子映射对齐、可以通过逐节点的预测图生成方式降低模型计算量;另外,通过对本专利技术分子图预测模型进行双向(合成方向/逆合方向)训练还可以基于同一个模型结构处理两类预测任务(合成/逆合成预测任务)。
[0006]为实现上述目的,本专利技术实施例第一方面提供了一种合成及逆合成分子图预测模型的处理方法,所述方法包括:构建分子图预测模型;按反应物到生成物的合成预测方向对所述分子图预测模型进行训练得到对应的生成物预测模型参数;并按生成物到反应物的逆合成预测方向对所述分子图预测模型进行
训练得到对应的反应物预测模型参数;在处理合成预测任务时,基于所述生成物预测模型参数对所述分子图预测模型进行参数配置;并将配置后的所述分子图预测模型作为对应的第一预测模型;并基于所述第一预测模型根据输入的反应物分子图或输入的所述反应物分子图及对应的反应物分子图三维构象进行生成物分子图预测处理得到对应的第一生成物分子图;在处理逆合成预测任务时,基于所述反应物预测模型参数对所述分子图预测模型进行参数配置;并将配置后的所述分子图预测模型作为对应的第二预测模型;并基于所述第二预测模型根据输入的生成物分子图或输入的所述生成物分子图及对应的生成物分子图三维构象进行反应物分子图预测处理得到对应的第一反应物分子图。
[0007]优选的,所述分子图预测模型用于根据输入的目标分子图G
in
或输入的所述目标分子图G
in
及对应的目标分子图三维构象R
in
进行分子图预测处理得到对应的预测分子图G
out
;所述目标分子图G
in
为必选输入项,所述目标分子图三维构象R
in
为可选输入项;所述分子图预测模型的输入端包括第一、第二模型输入端;所述第一模型输入端用于接收可选输入的所述目标分子图三维构象R
in
;所述第二模型输入端用于接收输入的所述目标分子图G
in
;所述分子图预测模型的输出端用于输出所述预测分子图G
out
;所述目标分子图G
in
包括节点特征集N
in
和边特征集E
in
;所述节点特征集N
in
包括多个节点特征n
in
,每个所述节点特征n
in
对应一个原子和一个节点标识;所述边特征集E
in
包括多个边特征e
in
,每个所述边特征e
in
对应一个原子对连接键和这对原子对应的两个节点标识;所述目标分子图三维构象R
in
包括多个原子三维特征r
in
,所述原子三维特征r
in
与所述目标分子图G
in
的所述节点特征n
in
一一对应,所述原子三维特征r
in
为对应的所述节点特征n
in
的对应原子的三维特征,所述原子三维特征r
in
包括对应原子的三维坐标;所述预测分子图G
out
包括节点特征集N
out
和边特征集E
out
;所述节点特征集N
out
包括多个节点特征n
out
,每个所述节点特征n
out
对应一个原子和一个节点标识,所述节点特征n
out
包括对应原子的原子类型、形式电荷和连接氢原子数量;所述边特征集E
out
包括多个边特征e
out
,每个所述边特征e
out
对应一个原子对连接键和这对原子对应的两个节点标识,所述边特征e
out
包括对应原子对的连接键类型;所述预测分子图G
out
与所述目标分子图G
in
中,对应相同原子的所述节点特征n
in
和所述节点特征n
out
在各自节点特征集中的节点标识和节点排列顺序彼此对齐。
[0008]优选的,所述分子图预测模型包括编码器、解码器、时变图级特征提取单元和时变图级特征降维单元;所述编码器的输入端包括第一、第二编码器输入端,所述第一、第二编码器输入端分别与所述第一、第二模型输入端连接;所述编码器的输出端与所述解码器的第一解码器输入端连接;所述解码器的输入端包括所述第一解码器输入端和第二解码器输入端,所述第二解码器输入端与所述时变图级特征降维单元的输出端连接;所述解码器的输出端与所述时变图级特征提取单元的输入端连接,还与模型的输出端连接;所述时变图级特征提取单元的输出端与所述时变图级特征降维单元的输入端连接;
所述编码器用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种合成及逆合成分子图预测模型的处理方法,其特征在于,所述方法包括:构建分子图预测模型;按反应物到生成物的合成预测方向对所述分子图预测模型进行训练得到对应的生成物预测模型参数;并按生成物到反应物的逆合成预测方向对所述分子图预测模型进行训练得到对应的反应物预测模型参数;在处理合成预测任务时,基于所述生成物预测模型参数对所述分子图预测模型进行参数配置;并将配置后的所述分子图预测模型作为对应的第一预测模型;并基于所述第一预测模型根据输入的反应物分子图或输入的所述反应物分子图及对应的反应物分子图三维构象进行生成物分子图预测处理得到对应的第一生成物分子图;在处理逆合成预测任务时,基于所述反应物预测模型参数对所述分子图预测模型进行参数配置;并将配置后的所述分子图预测模型作为对应的第二预测模型;并基于所述第二预测模型根据输入的生成物分子图或输入的所述生成物分子图及对应的生成物分子图三维构象进行反应物分子图预测处理得到对应的第一反应物分子图。2.根据权利要求1所述的合成及逆合成分子图预测模型的处理方法,其特征在于,所述分子图预测模型用于根据输入的目标分子图G
in
或输入的所述目标分子图G
in
及对应的目标分子图三维构象R
in
进行分子图预测处理得到对应的预测分子图G
out
;所述目标分子图G
in
为必选输入项,所述目标分子图三维构象R
in
为可选输入项;所述分子图预测模型的输入端包括第一、第二模型输入端;所述第一模型输入端用于接收可选输入的所述目标分子图三维构象R
in
;所述第二模型输入端用于接收输入的所述目标分子图G
in
;所述分子图预测模型的输出端用于输出所述预测分子图G
out
;所述目标分子图G
in
包括节点特征集N
in
和边特征集E
in
;所述节点特征集N
in
包括多个节点特征n
in
,每个所述节点特征n
in
对应一个原子和一个节点标识;所述边特征集E
in
包括多个边特征e
in
,每个所述边特征e
in
对应一个原子对连接键和这对原子对应的两个节点标识;所述目标分子图三维构象R
in
包括多个原子三维特征r
in
,所述原子三维特征r
in
与所述目标分子图G
in
的所述节点特征n
in
一一对应,所述原子三维特征r
in
为对应的所述节点特征n
in
的对应原子的三维特征,所述原子三维特征r
in
包括对应原子的三维坐标;所述预测分子图G
out
包括节点特征集N
out
和边特征集E
out
;所述节点特征集N
out
包括多个节点特征n
out
,每个所述节点特征n
out
对应一个原子和一个节点标识,所述节点特征n
out
包括对应原子的原子类型、形式电荷和连接氢原子数量;所述边特征集E
out
包括多个边特征e
out
,每个所述边特征e
out
对应一个原子对连接键和这对原子对应的两个节点标识,所述边特征e
out
包括对应原子对的连接键类型;所述预测分子图G
out
与所述目标分子图G
in
中,对应相同原子的所述节点特征n
in
和所述节点特征n
out
在各自节点特征集中的节点标识和节点排列顺序彼此对齐。3.根据权利要求2所述的合成及逆合成分子图预测模型的处理方法,其特征在于,所述分子图预测模型包括编码器、解码器、时变图级特征提取单元和时变图级特征降维单元;所述编码器的输入端包括第一、第二编码器输入端,所述第一、第二编码器输入端分别与所述第一、第二模型输入端连接;所述编码器的输出端与所述解码器的第一解码器输入端连接;
所述解码器的输入端包括所述第一解码器输入端和第二解码器输入端,所述第二解码器输入端与所述时变图级特征降维单元的输出端连接;所述解码器的输出端与所述时变图级特征提取单元的输入端连接,还与模型的输出端连接;所述时变图级特征提取单元的输出端与所述时变图级特征降维单元的输入端连接;所述编码器用于对所述第一编码器输入端上是否输入了所述目标分子图三维构象R
in
进行识别;若否,则根据输入的所述目标分子图G
in
进行分子图特征编码生成对应的编码器输出图G
enc
向所述解码器发送;若是,则根据输入的所述目标分子图G
in
和所述目标分子图三维构象R
in
进行分子图特征编码生成对应的所述编码器输出图G
enc
向所述解码器发送;所述解码器用于按自回归方式进行逐节点单步分子图预测处理得到对应的单步预测分子图并输出,具体为:所述解码器在自回归过程中的任一单步时间点i+1上,根据所述编码器输出图G
enc
、所述解码器在前一单步时间点i上输出的单步预测分子图G
i
以及所述时变图级特征降维单元反馈的与所述单步预测分子图G
i
对应的时变图降维特征D
s,i
对当前单步时间点i+1上的新节点进行预测得到对应的第一新节点;并将所述第一新节点对应的新节点特征和新边特征与所述单步预测分子图G
i
的节点特征集和边特征集进行特征融合得到对应的单步预测分子图G
i+1
;并对当前所述第一新节点是否为结束节点进行识别,若否则将当前单步时间点i+1上输出的所述单步预测分子图G
i+1
向所述时变图级特征提取单元输出,若是则将当前单步时间点i+1上输出的所述单步预测分子图G
i+1
作为对应的所述预测分子图G
out
向所述分子图预测模型的输出端发送;所述时变图级特征提取单元用于对所述单步预测分子图G
i
进行特征提取处理得到对应的时变图特征D
i
向所述时变图级特征降维单元发送;所述时变图级特征降维单元用于对所述时变图特征D
i
进行特征降维处理得到对应的所述时变图降维特征D
s,i
向所述解码器反馈。4.根据权利要求3所述的合成及逆合成分子图预测模型的处理方法,其特征在于,所述编码器根据输入的所述目标分子图G
in
进行分子图特征编码的表达式为:;所述编码器根据输入的所述目标分子图G
in
和所述目标分子图三维构象R
in
进行分子图特征编码的表达式为:;其中,f
enc
()为所述编码器的模型推理过程,所述编码器的模型推理过程中所述目标分子图三维构象R
in
为可选输入项;θ
enc
为所述编码器的模型参数;N
in
为模型输入的所述目标分子图G
in
的节点特征集;E
in
为模型输入的所述目标分子图G
in
的边特征集;隐变量PE为与所述目标分子图G
in
对应的一维位置编码向量;所述编码器在编码过程中将位置编码向量PE与所述节点特征集N
in
的节点特征进行特征融合;所述解码器在自回归过程中的任一单步时间点i+1上,根据所述编码器输出图G
enc
、所述解码器在前一单步时间点i上输出的单步预测分子图G
i
以及所述时变图级特征降维单元反馈的与所述单步预测分子图G
i
对应的时变图降维特征D
s,i
对当前单步时间点i+1上的新节点进行预测的表达式为:
;其中,f
dec

t
()、f
dec

c
()、f
dec

h
()、f
dec

e
()分别为所述解码器的原子类型推理过程、形式电荷推理过程、氢原子连接数量推理过程和连接键类型推理过程,所述解码器的所有推理过程均基于波束搜索算法来生成最优候选预测;θ
dec
为所述解码器的模型参数;N
i
为所述单步预测分子图G
i
的节点特征集;隐变量PE为与所述编码器共享的一维位置编码向量;n
i+1
为所述解码器在当前单步时间点i+1上预测出的所述第一新节点的所述新节点特征,所述新节点特征n
i+1
由t
i+1
、c
i+1
、h
i+1
组成,t
i+1
、c
i+1
、h
i+1
分别为与所述第一新节点对应的原子类型预测信息、形式电荷预测信息和连接氢原子数量预测信息;e
i+1
为与所述第一新节点对应的新边特征集合,由多个新边特征e
i+1,j
组成,所述新边特征e
i+1,j
为与所述第一新节点对应的第j条新边对应的原子对的连接键类型预测信息。5.根据权利要求4所述的合成及逆合成分子图预测模型的处理方法,其特征在于,所述编码器基于Uni

Mol+模型实现,所述Uni

Mol+模型为一个图到图的特征学习模型;所述解码器的模型结构参考传统transformer模型的传统解码器的模型结构进行构建;所述解码器包括Masked Multi

Head Attention层、Multi

Head Attention层和Feed ForFword层;所述解码器的所述Multi

Head Attention层和所述Feed ForFword层与所述传统解码器一致,但所述Masked Multi

Head Attention层的单头逻辑与所述传统解码器存在差异,所述解码器中所述Masked Multi

Head Attention层的单头逻辑为:;其中,X
i+1
为所述解码器在当前单步时间点i+1上将一维位置编码向量PE与前一单步时间点i输出的所述单步预测分子图G
i
的节点特征进行特征融合后得到的分子图;Q
i+1
、K
i+1
、V
i+1
为对所述分子图X
i+1
进行线性变换后得到的查询矩阵、键矩阵和值矩阵,所述查询矩阵Q
i+1
、所述键矩阵K
i+1
和所述值矩阵V
i+1
的特征维度相同,d
QKV
为三者相同的特征维度;D
s,i
为所述时变图级特征降维单元在当前单步时间点i+1上向所述解码器反馈的时变
图降维特征,d
s
为所述时变图降维特征D
s,i
的特征维度,d
s
<d
QKV
;U为用于对所述查询矩阵Q
i+1
进行特征降维的降维矩阵,所述降维矩阵U的形状为d
QKV
×
d
s
,Q
i+1
U为降维后的查询矩阵,查询矩阵Q
i+1
U的特征维度降至d
s
;M为加性掩码矩阵。6.根据权利要求3所述的合成及逆合成分子图预测模型的处理方法,其特征在于,所述按反应物到生成物的合成预测方向对所述分子图预测模型进行训练得到对应的生成物预测模型参数,具体包括:步骤61,基于预设的第一训练:验证:测试比例将预设的第一数据集切分为对应的第一训练集、第一验证集和第一测试集;其中,所述第一数据集包括多个第一训练数据;所述第一训练数据包括反应物分子图、反应物三维原子坐标集和对应的生成物分子图,所述第一训练数据中的所述反应物三维原子坐标集为可选项;第一训练:验证:测试比例=第一训练集的第一训练数据数量:第一验证集的第一训练数据数量:第一测试集的第一训练数据数量;所述反应物分子图包括反应物节点特征集和反应物边特征集,所述反应物节点特征集包括多个反应物节点特征,所述反应物边特征集包括多个反应物边特征,每个所述反应物节点特征对应一个原子和一个节点标识,每个所述反应物边特征对应一个原子对连接键和这对原子对应的两个节点标识;所述生成物分子图包括生成物节点特征集和生成物边特征集,所述生成物节点特征集包括多个生成物节点特征,所述生成物边特征集包括多个生成物边特征,每个所述生成物节点特征对应一个原子和一个节点标识,每个所述生成物边特征对应一个原子对连接键和这对原子对应的两个节点标识;所述反应物三维原子坐标集包括多个反应物三维原子坐标,所述反应物三维原子坐标与所述反应物分子图的所述反应物节点特征一一对应,所述反应物三维原子坐标为对应的所述反应物节点特征的对应原子的三维坐标;步骤62,将所述第一训练集的第一个所述第一训练数据提取出来作为对应的当前训练数据;步骤63,将所述当前训练数据的所述反应物分子图、所述反应物三维原子坐标集和所述生成物分子图作为对应的当前反应物分子图、当前反应物原子坐标集和当前生成物分子图;并根据所述当前反应物分子图、所述当前反应物原子坐标集和所述当前生成物分子图进行模型输入数据和标签数据预处理生成对应的第一输入分子图、第一输入原子坐标集和第一标签分子图;其中,所述第一标签分子图与所述第一输入分子图之间存在原子映射对齐关系;步骤64,对预设的可选项选择配置进行随机设置;其中,所述可选项选择配置包括选择可选项和不选择可选项;步骤65,对所述可选项选择配置进行识别;若所述可选项选择配置为选择可选项,则将所述第一输入分子图和所述第一输入原子坐标集作为对应的所述目标分子图G
in
和所述目标分子图三维构象R
in
输入所述分子图预测模型进行生成物分子图预测并将所述分子图预测模型输出的所述预测分子图G
out
作为对应的第一生成物预测分子图;若所述可选项选择配置为不选择可选项,则将所述第一输入分子图作为对应的所述目标分子图G
in
输入所述分子图预测模型进行生成物分子图预测并将所述分子图预测模型输出的所述预测分子图G
out
作为对应的所述第一生成物预测分子图;并将所述第一生成物预测分子图和所述第一标签
分子图输入预设的第一交叉熵损失函数进行对应的交叉熵损失值计算到对应的第一损失值;所述第一交叉熵损失函数为多分类交叉熵损失函数;步骤66,对所述第一损失值是否满足预设的第一损失值范围进行识别;若所述第一损失值误差满足所述第一损失值范围,则对所述当前训练数据是否为所述第一训练集的最后一个所述第一训练数据进行识别,若是则转至步骤67,若否则将所述第一训练集的下一个所述第一训练数据提取出来作为新的所述当前训练数据并返回步骤63继续训练;若所述第一损失值误差不满足所述第一损失值范围,则对所述分子图预测模型的模型参数进行优化并在参数优化后返回步骤65继续训练;步骤67,将所述第一验证集的第一个所述第一训练数据提取出来作为对应的所述当前验证数据;步骤68,将所述当前验证数据的所述反应物分子图、所述反应物三维原子坐标集和所述生成物分子图作为对应的当前反应物分子图、当前反应物原子坐标集和当前生成物分子图;并根据所述当前反应物分子图、所述当前反应物原子坐标集和所述当前生成物分子图进行模型输入数据和标签数据预处理生成对应的第一输入分子图、第一输入原子坐标集和第一标签分子图;其中,所述第一标签分子图与所述第一输入分子图之间存在原子映射对齐关系;步骤69,对预设的所述可选项选择配置进行随机设置;其中,所述可选项选择配置包括选择可选项和不选择可选项;步骤70,对所述可选项选择配置进行识别;若所述可选项选择配置为选择可选项,则将所述第一输入分子图和所述第一输入原子坐标集作为对应的所述目标分子图G
in
和所述目标分子图三维构象R
in
输入所述分子图预测模型进行生成物分子图预测并将所述分子图预测模型输出的所述预测分子图G
out
作为对应的第二生成物预测分子图;若所述可选项选择配置为不选择可选项,则将所述第一输入分子图作为对应的所述目标分子图G
in
输入所述分子图预测模型进行生成物分子图预测并将所述分子图预测模型输出的所述预测分子图G
out
作为对应的所述第二生成物预测分子图;并将所述第二生成物预测分子图和所述第一标签分子图输入预设的第二交叉熵损失函数进行对应的交叉熵损失值计算到对应的第二损失值;所述第二交叉熵损失函数为多分类交叉熵损失函数;步骤71,对所述第二损...

【专利技术属性】
技术研发人员:么琳王震柯国霖郑行向上张林峰孙伟杰
申请(专利权)人:北京深势科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1