当前位置: 首页 > 专利查询>浙江大学专利>正文

一种基于无模板的分子多步逆合成预测方法和装置制造方法及图纸

技术编号:39855163 阅读:12 留言:0更新日期:2023-12-30 12:53
本发明专利技术公开了一种基于无模板的分子多步逆合成预测方法和装置,包括获取包括原子字符串和键特征矩阵的药物分子数据,药物分子数据对应的反应物数据,组成训练数据;构建无模板的单步逆合成模型,利用训练数据对单步逆合成模型进行参数优化,利用优化后的单步逆合成模型进行多步逆合成,同时还可以给定一个具体目标药物分子,使用

【技术实现步骤摘要】
一种基于无模板的分子多步逆合成预测方法和装置


[0001]本专利技术属于分子逆合成
,具体涉及一种基于无模板的分子多步逆合成预测方法和装置


技术介绍

[0002]分子逆合成是有机合成领域的一项重要技术,它允许化学家从目标分子出发,通过一系列逆向的化学反应步骤,最终合成所需的目标化合物

逆合成方法在新药研发

材料科学

农业化学和化学生物学等领域具有广泛的应用价值

随着计算机辅助合成
(CAS)
技术和机器学习方法的发展,逆合成领域取得了显著进展,为加速有机合成化学的发展和新化合物的发现提供了新的途径

[0003]传统的有机合成通常采用线性的合成路线,从较简单的原料出发,通过连续的反应步骤逐步构建目标分子

然而,在合成复杂分子的过程中,传统方法可能会面临许多挑战,如底物选择受限

低产率

不可避免的副反应和繁琐的纯化过程等问题
。<br/>因此,寻求高本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种基于无模板的分子多步逆合成预测方法,其特征在于,包括以下步骤:获取包括原子字符串和键特征矩阵的药物分子数据,药物分子数据对应的反应物数据,组成训练数据;构建无模板的单步逆合成模型,包括编码模块

反应中心检测模块以及解码模块,编码模块采用全局注意力头对药物分子数据进行全局编码,同时采用局部注意力头对药物分子数据中每个原子的一跳邻域原子进行局部编码,综合全局编码结果和局域编码结果作为总编码结果,反应中心检测模块基于总编码结果预测反应中心原子,解码模块采用全局注意力头对重编码结果进行全局解码,同时采用局部注意力头对每个原子的一跳邻域反应中心原子进行局域解码,综合全局解码结果和局域解码结果的总解码结果作为反应物预测结果;利用训练数据对单步逆合成模型进行参数优化,利用优化后的单步逆合成模型进行多步逆合成
。2.
根据权利要求1所述的基于无模板的分子多步逆合成预测方法,其特征在于,所述编码模块包含多层编码层,每层编码层均包括用于全局编码的全局注意力头和用于局域编码的局部注意力头;全局注意力头的编码过程用公式表示为:局部注意力头的编码过程用到键特征矩阵,用公式表示为:其中,和分别表示第
i
个原子在第
l+1
层的全局编码结果和局部编码结果,
j∈N(i)
表示第
j
个原子属于第
i
个原子的邻居原子,
σ
(
·
)
表示
softmax
操作,操作,和表示第
i
个原子和第
j
个原子在第
l
层的总编码结果,
W
Q
、W
K
、W
V
表示用于查询
q、

k
和值
v
的投影矩阵,上标
T
表示转置,符号

表示点乘操作,
d
表示向量
k
的维度,表示第
l
层中第
i
个原子和第
j
个原子之间的键特征矩阵,引入键特征矩阵参与局部注意力能够实现对每个原子的一跳邻域原子进行局部编码;综合全局编码结果和局域编码结果作为总编码结果,用公式表示为:其中,
h
l+1
表示第
l+1
层的总编码结果,符号
[

]
表示拼接,
Linear(
·
)
表示线性映射
。3.
根据权利要求2所述的基于无模板的分子多步逆合成预测方法,其特征在于,在编码模块的每层编码层中,还包含键特征矩阵的更新过程,用公式表示为:
其中,表示第
l
层中第
i
个原子和第
j
个原子之间的键特征矩阵,
FFN(
·
)
表示全连接操作,更新后的键特征矩阵参与下一层的局域编码过程
。4.
根据权利要求1所述的基于无模板的分子多步逆合成预测方法,其特征在于,所述反应中心检测模块中,采用全连接层分别针对原子和键进行反应中心的预测,用公式表示为:
P
rc
(s
i
)

σ
(FFN
atom
(h
i
))P
rc
(e
ij
)

σ
(FFN
bond
(A
ij
))
其中,
h
i

A
ij
分别表示编码模块最后一编码成输出的第
i
个原子
s
i
的总编码结果和第
i
个原子与第
j
个原子之间键
e
ij
的键特征矩阵,
FFN
atom
(h
i
)
表示对
h
i
进行全连接操作,
FFN
bond
(A
ij
)
表示对
A
ij
进行全连接操作,
σ
(
·
)
表示
softmax
操作,
P
rc
(s
i
)

P
rc
(e
ij
)
分别表示对
s
i

...

【专利技术属性】
技术研发人员:吴健胡朝文曹政郑波徐红霞
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1