基于深度学习的化学反应转化率预测方法、系统及介质技术方案

技术编号:32733827 阅读:13 留言:0更新日期:2022-03-20 08:39
本发明专利技术公开了基于深度学习的化学反应转化率预测方法、系统及介质,方法包括:从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型A,并进行反应物类型A的反应物和化学反应对应的化学反应式R的分词及特征提取,接着通过注意力机制求反应物类型A的反应物的深层表征信息T

【技术实现步骤摘要】
基于深度学习的化学反应转化率预测方法、系统及介质


[0001]本专利技术涉及化学反应的
,尤其涉及到基于深度学习的化学反应转化率预测方法、系统及介质。

技术介绍

[0002]反应转化率是化学反应的实际反应产物与理论反应产物的比值,理想条件下,一个化学反应的转化率应为100%,但是在现实条件下,受到温度、浓度等条件的影响,大部分反应的转化率都达不到100%。
[0003]在化学反应流程设计中,通过几步甚至几十步反应生成所需产物的情况较为常见。反应流程中不论哪一步转化率过低,都会因为累加效应对整个反应流程造成致命影响。因此,设计转化率高的化学反应显得尤为重要。
[0004]近些年来,深度学习在各个领域都取得了不错的成效,许多人开始尝试使用深度学习的方法预测反应转化率,以此帮助整个化学反应流程的设计,但现有的化学反应转化率预测模型大多面向某种特定的反应类型,如[1]Ahneman D T,Estrada J G,Lin S,Dreher S D and Doyle A G 2018 Predicting reaction performance in C

Ncross

coupling using machine learning Science 360 186

90.和[2]Chuang K Vand Keiser M J 2018 Comment on“Predicting reaction performance in C
–<br/>N cross

coupling using machine learning”Science 362 6416.,这类模型通用性不强。最近,虽然基于自然语言处理技术的通用型转化率预测模型[3]Schwaller P,Vaucher A C,Laino T,et al.Prediction of chemical reaction yields using deep learning[J].Machine Learning:Science and Technology,2021,2(1):015016也被提出,但该方法直接将整个反应式作为模型的输入,并未充分考虑不同的反应物对反应式及转化率的影响,没有充分利用反应物信息。

技术实现思路

[0005]本专利技术的目的在于克服现有技术的不足,提供一种预测精度高的化学反应转化率预测方法。
[0006]为实现上述目的,本专利技术所提供的技术方案为:
[0007]化学反应转化率预测方法,包括以下步骤:
[0008]S1、从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型A;
[0009]S2、进行反应物类型A的反应物和化学反应对应的化学反应式R的分词及特征提取,得到对应的特征X
r
和X
a

[0010]S3、结合特征X
r
和X
a
,通过注意力机制求取反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m

[0011]S4、利用宽度学习系统对反应物类型A的反应物的深层表征信息T
a
、化学反应对应
的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m
进行融合,并预测化学反应转化率。
[0012]进一步地,所述步骤S1根据每种反应物类型下的不同分子数目,将不同分子数目最多的反应物类型作为对化学反应转化率影响最大的反应物类型。
[0013]如,若某一类化学反应式R定义为A+B

&gt;C,其中A={A1,A2,

,A
n
},B={B1,B2,

,B
m
},A类型的反应物中有n种不同的分子,B类型的反应物中有m中不同的分子。若n&gt;m,则将A类型作为对化学反应转化率影响最大的反应物类型。
[0014]进一步地,所述步骤S2包括:
[0015]S2

1、将反应物类型A的反应物和化学反应对应的化学反应式R均转化为SMILES序列,得到S
r
和S
a

[0016]S2

2、利用RXNFP模型对反应物类型A的反应物和化学反应对应的化学反应式R的SMILES序列S
r
和S
a
进行分词及特征提取,得到进行分词及特征提取,得到其中N
r
为化学反应式R中分词节点的个数,N
a
为反应物类型A的反应物中分词节点的个数,d
b
表示输出的特征维度,cls分词不表示任何语义,在于获取反应式或分子的整体特征。
[0017]进一步地,所述步骤S3使用多头点积缩放注意力机制求取反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m
,过程包括:
[0018]注意力函数为:
[0019][0020]其中,查询集Q={q1,q2,

,q
n
},键集合K={k1,k2,

,k
m
},d
k
为k
i
的维度,i∈[1,m];
[0021]在平行子空间中分别学习h个不同的注意力分数,并将该h个不同的注意力分数拼接起来:
[0022]MultiHead(K,Q,V)=Concat(heak1,head2,

,head
h
)W
o
[0023]head
i
=Attention(K,Q,V)
[0024]其中W
o
为需要学习的参数,
[0025]为了更深入挖掘反应式信息和反应物信息,使用多头注意力机制和残差模块对反应物类型A的反应物、化学反应对应的化学反应式R以及该两者的关系进行自注意力计算:
[0026][0027][0028][0029]其中Norm为标准化层,为
可学习的注意力参数,维度均为该层输出T
r
为化学反应对应的化学反应式R的深层表征信息,T
a
为反应物类型A的反应物的深层表征信息,T
m
为两者的关系信息。
[0030]进一步地,所述步骤S4包括:
[0031]S4

1、将反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.化学反应转化率预测方法,其特征在于,包括以下步骤:S1、从参加化学反应的反应物的所属类型中选出对化学反应转化率影响最大的反应物类型A;S2、进行反应物类型A的反应物和化学反应对应的化学反应式R的分词及特征提取,得到对应的特征X
r
和X
a
;S3、结合特征X
r
和X
a
,通过注意力机制求取反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m
;S4、利用宽度学习系统对反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m
进行融合,并预测化学反应转化率。2.根据权利要求1所述的化学反应转化率预测方法,其特征在于,所述步骤S1根据每种反应物类型下的不同分子数目,将不同分子数目最多的反应物类型作为对化学反应转化率影响最大的反应物类型。3.根据权利要求1所述的化学反应转化率预测方法,其特征在于,所述步骤S2包括:S2

1、将反应物类型A的反应物和化学反应对应的化学反应式R均转化为SMILES序列,得到S
r
和S
a
;S2

2、利用RXNFP模型对反应物类型A的反应物和化学反应对应的化学反应式R的SMILES序列S
r
和S
a
进行分词及特征提取,得到进行分词及特征提取,得到其中N
r
为化学反应式R中分词节点的个数,N
a
为反应物类型A的反应物中分词节点的个数,d
b
表示输出的特征维度,cls分词不表示任何语义,在于获取反应式或分子的整体特征。4.根据权利要求1所述的化学反应转化率预测方法,其特征在于,所述步骤S3使用多头点积缩放注意力机制求取反应物类型A的反应物的深层表征信息T
a
、化学反应对应的化学反应式R的深层表征信息T
r
、反应物和反应式的关系信息T
m
,过程包括:注意力函数为:其中,查询集Q={q1,q2,

,q
n
},键集合K={k1,k2,

,k
m
},d
k
为k
i
的维度,i∈[1,m];在平行子空间中分别学习h个不同的注意力分数,并将该h个不同的注意力分数拼接起来:MultiHead(K,Q,V)=Concat(head1,head2,

,head
h
)W
o
head
i
=Attention(K,Q,V)其中W
o
为需要学习的参数,为了更深入挖掘反应式信息和反应物信息,使用多头注意力机制和残差模块对反应物类型A的反应物、化学反应对应的化学...

【专利技术属性】
技术研发人员:陈俊龙刘如意孟献兵
申请(专利权)人:华南理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1