一种化合物逆合成方法及装置制造方法及图纸

技术编号:36771587 阅读:19 留言:0更新日期:2023-03-08 21:46
本发明专利技术提供了一种化合物逆合成方法及装置,涉及逆合成技术领域,特别指一种结合多尺度卷积与自注意力编码的化合物逆合成方法及装置。包括通过基于Transformer的序列模型提取原化合物的化学分子式特征;通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取;将多尺度局部特征和差分特征输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。本发明专利技术提出的化合物逆合成方法在降低化合物研发成本、提高化合物研发效率的场景下具有显著的应用价值,为实现全面、准确的化合物逆合成以及化合物合成的广泛应用奠定了模型基础。以及化合物合成的广泛应用奠定了模型基础。以及化合物合成的广泛应用奠定了模型基础。

【技术实现步骤摘要】
一种化合物逆合成方法及装置


[0001]本专利技术涉及逆合成
,特别是指一种结合多尺度卷积与自注意力编码的化合物逆合成方法及装置。

技术介绍

[0002]化合物逆合成是当今研究化合物合成路线的重要手段之一,该合成方法以通过目标化合物寻找多种合成原料为研究路线。在化合物合成的研究中,由简单原料合成指定的复杂化合物是困难的,因此通过化合物逆合成辅助设计方法是十分重要的。对于化合物逆合成推理的一般过程,化合物被逐步分解为简单原料,最终选择出更为合理的化合物合成工艺路线。为了后续将该方法扩展应用于新化合物的逆合成,需要模型对于推理过程具有较强的适应能力。化合物逆合成方法一般利用循环神经网络和基于注意力机制的Transformer模型。在这些方法中,首先目标化合物根据SMILES规则被转化为线性的序列形式,然后序列输入到特定的深度神经网络中对特征序列完成逆向合成推理。其中,基于循环神经网络的方法依赖隐式记忆建模和递归输出,推理速度较慢。另外,该方法还有着两个问题:1、化学分子序列过长易产生梯度爆炸的问题;2、多层循环神经网络的堆叠设计易导致模型退化和无法学习更加丰富特征的问题。近期,基于Transformer的方法越来越受到重视。基于Transformer的方法不依赖隐藏信息建模,而是直接计算每个序列特征之间的关系。另外,基于Transformer的方法能够同步完成化学分子序列之间的信息传递,学习速度较快而且避免了梯度爆炸等问题。但是在化合物逆合成的问题中,基于Transformer的方法不通过隐藏信息传递来建模,而是直接计算每个序列特征之间的关系,能够同步完成化学分子序列之间的信息传递,因而不会出现循环神经网络中的梯度爆炸等问题。虽然基于Transformer的方法能够解决RNN的长期依赖问题,但是却过于关注序列的全局特征,易产生对化学分子的局部特征提取不充分的问题。

技术实现思路

[0003]针对现有技术中,Transformer模型过于关注化学分子序列的全局特征,易产生化学分子的局部特征提取不充分的问题,本专利技术提出了一种化合物逆合成方法及装置。
[0004]为解决上述技术问题,本专利技术提供如下技术方案:
[0005]一方面,提供了一种化合物逆合成方法,该方法应用于电子设备,包括以下步骤:
[0006]S1:通过基于Transformer的序列模型提取原化合物的化学分子式特征;
[0007]S2:通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取;
[0008]S3:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0009]可选地,S1中,通过基于Transformer的序列模型提取原化合物的化学分子式特征,包括:
[0010]S11:将原化合物的化学分子式转化为SMILES格式的线性表示,并进行分词;
[0011]S12:通过基于Transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0012]S13:通过自适应池化法将特征序列的长度进行统一。
[0013]可选地,步骤S2中,通过多尺度卷积模块,对化学分子式特征进行多尺度局部特征和差分特征提取,包括:
[0014]S21:通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0015]S22:通过基于Transformer的序列模型进行特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0016]可选地,步骤S21中,通过多尺度卷积特征融合模块,对特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征,包括:
[0017]将化学分子的特征序列X输入到一个含有三个不同尺寸卷积核的卷积模块S中,产生多种感受野的局部特征其中卷积模块S中包含K个尺寸大小为1
×
f的卷积核其中K=3,f=2k+1;
[0018]对在维度J上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和Softmax函数,计算局部特征注意力图:
[0019][0020]其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;
[0021]注意力图A和特征Z重新整合出局部特征在维度J上进行特征融合获得新的局部特征。
[0022]可选地,步骤S3中,将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成,包括:
[0023]根据多尺度局部特征和差分特征,通过基于注意力机制的GRU的序列生成模型进行原化合物的回归生成;
[0024]其中,回归生成过程中,每一步的回归生成均根据上一时刻的输出对局部特征和差分特征进行特征选择;
[0025]基于注意力机制的GRU的序列生成模型在训练时,前一时刻的输入直接采用真值,推断时通过集束搜索生成原料序列,完成化合物逆合成。
[0026]可选地,步骤S3中,还包括:
[0027]基于注意力机制的GRU的序列生成模型在训练时,加入对注意力系数先验约束,若当前时刻的输出在产物的序列中未被搜索出时,则约束差分特征的注意力系数加和为1,局部特征的注意力系数加和为0;反之差分特征注意力系数加和为0,局部特征注意力系数加
和为1。
[0028]一方面,提供了一种化合物逆合成装置,该装置应用于电子设备,该装置包括:
[0029]初步特征提取模块,用于通过基于Transformer的序列模型提取原化合物的化学分子式特征;
[0030]局部特征提取模块,用于通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取;
[0031]回归合成模块,用于将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。
[0032]可选地,初步特征提取模块,用于将原化合物的化学分子式转化为SMILES格式的线性表示,并进行分词;
[0033]通过基于Transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;
[0034]通过自适应池化法将所述特征序列的长度进行统一。
[0035]可选地,局部特征提取模块,用于过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;
[0036]通过基于Transformer的序列模型进行所述特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。
[0037]可选地,局部特征提取模块,用于将化学分子的特征序列X输入到一个含有三个不同尺寸卷积本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种化合物逆合成方法,其特征在于,包括以下步骤:S1:通过基于Transformer的序列模型提取原化合物的化学分子式特征;S2:通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取;S3:将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成。2.根据权利要求1所述的方法,其特征在于,所述S1中,通过基于Transformer的序列模型提取原化合物的化学分子式特征,包括:S11:将原化合物的化学分子式转化为SMILES格式的线性表示,并进行分词;S12:通过基于Transformer的序列模型提取各个分词的特征,表示为化学分子的特征序列;S13:通过自适应池化法将所述特征序列的长度进行统一。3.根据权利要求2所述的方法,其特征在于,所述步骤S2中,通过多尺度卷积模块,对所述化学分子式特征进行多尺度局部特征和差分特征提取,包括:S21:通过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征;S22:通过基于Transformer的序列模型进行所述特征序列的全局特征的建模,将全局特征与新的局部特征相减,得到差分特征。4.根据权利要求3所述的方法,其特征在于,所述步骤S21中,通过多尺度卷积特征融合模块,对所述特征序列通过不同尺寸的卷积核进行卷积操作,得到多个局部特征图,对多个局部特征图进行融合获得新的局部特征,包括:将化学分子的特征序列X输入到一个含有三个不同尺寸卷积核的卷积模块S中,产生多种感受野的局部特征其中J=3,卷积模块S中包含K个尺寸大小为1
×
f的卷积核其中K=3,f=2k+1;对在维度J上进行堆叠以得到并根据下述公式(1)结合进行矩阵乘法和Softmax函数,计算局部特征注意力图:其中,a
ji
表示第i个尺度的局部特征图对第j个尺度的局部特征图的影响;注意力图A和特征Z重新整合出局部特征在维度J上进行特征融合获得新的局部特征。5.根据权利要求1所述的方法,其特征在于,所述步骤S3中,将多尺度局部特征和差分特征作为输入数据,输入至基于注意力机制的GRU的序列生成模型,进行原化合物的回归生成,完成化合物逆合成,包括:
根据所述多尺度局部特征和差分特征,通过基于注意力机制的GRU的序列生成模型进行原化合物的回归生成;其中,回归生成过程中,每一步的...

【专利技术属性】
技术研发人员:侯静怡刘志杰贺威苏磊孟献兵
申请(专利权)人:北京科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1