解决逆合成中产物反应中心预测的方法技术

技术编号:35096405 阅读:18 留言:0更新日期:2022-10-01 16:59
本发明专利技术涉及到解决逆合成中产物反应中心预测的方法。包括构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图,对逆合成的所述目标分子实施反应中心的预测并利用反应中心以推测出反应物。反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。组节点以及该一组被选定的节点之间的边。组节点以及该一组被选定的节点之间的边。

【技术实现步骤摘要】
解决逆合成中产物反应中心预测的方法


[0001]本专利技术主要涉及到计算化学领域,更确切的说,涉及到一种解决逆合成中产物反应中心预测的方法。

技术介绍

[0002]在人工智能和机器学习领域,已经逐渐被引入到各个科学领域,并且发挥着重要的作用例如在化学领域,由于在不同条件之下的化学反应是无穷变化的,因此这就导致化学这类研发工作受限于结果的无穷性。在制备化合物分子时,研究人员需要大量的时间和精力才能设计出合理的有机合成路线,若基于人工智能技术,以此辅助研究人员进行有机合成路线设计就可大大提高研究研发化学药物分子和其他化合物的效率。
[0003]目前基于人工智能进行分子逆合成路线设计的方法含以下几种:主要是基于蒙特卡罗树搜索(Monte Carlo Tree Search,MCTS)算法进行随机搜索的步骤直到找到解决方案或达到最大深度为止,同时引入符号人工智能来完成分子逆合成路线的设计。另一种是基于深度强化学习技术,确定分子逆合成反应每一步的模板选择策略,最终得到分子逆合成路线及还有一种是基于分布式训练架构,结合深度强化学习技术加速最优分子逆合成路线的构建以及代价函数的网络拟合,通过该网络完成对训练集分子逆合成路线的设计。
[0004]传统的逆合成路线方法进行分子逆合成路线设计都耗时较长,并且传统逆合成方法在构建分子逆合成树的初期就需要决定其最大的探索高度,这样的设计思想导致如果最大的探索高度过小的话,那么一些化学式较为复杂的分子很难在有限的给定高度内顺利完成分子逆合成树的构建;反之,如果最大探索高度过大的话,则所需的时间会成指数增长而导致分子逆合成路线设计的效率和准确率较低。
[0005]图神经网络(GNN)在处理图像数据时具很强的特征抽取能力和整合能力,这主要得益于其卷积核(kernel/filter)的参数共享机制以及加权平均机制。卷积本质上其实就是一种加权求和的过程,而卷积核的参数就是不同像素点对应的权重,并且不同的各类图片都共享同一个卷积核。这使得CNN能通过对卷积核参数的迭代更新来隐式的学习图像中具有的像素排列规律,进而通过学习到不同的形状特征和空间特征。
[0006]计算化学中的一个基本问题是找到一组反应物来合成目标分子,即对反应物进行预测并称为逆合成。本申请旨在通过量子图神经网络解决反应中心预测问题。

技术实现思路

[0007]本申请一种解决逆合成中产物反应中心预测的方法,包括:
[0008]构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图,对所述目标分子实施反应中心的预测,利用所述反应中心以推测出所述反应物;
[0009]所述反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。
[0010]上述的方法,其中:
[0011]由不同反应物对应的诸多所述第一类无向图合成一个完整的所述第二类无向图。
[0012]上述的方法,其中:
[0013]在所述第二类无向图中计算完所有所述反应中心的评分后,选择评分最高的一个所述反应中心来定义出所述目标分子的最终断键位置处。
[0014]上述的方法,其中:
[0015]在所述第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义连线关系,籍此构建所述第二类无向图的图结构。
[0016]上述的方法,其中:
[0017]利用预设的变分量子线路聚合所述反应中心的节点特征数据和边特征数据,经过变分量子线路的演化后得到量子数据以及测量出对应的经典数据。
[0018]上述的方法,其中:
[0019]通过矩阵叉乘的方式,聚合每一个节点所涉及到的边的经典数据,将聚合结果再乘上任一节点的原始特数据征,视为该任一节点的更新后的信息。
[0020]上述的方法,其中:
[0021]在多次迭代各个节点的信息之后,计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征。
[0022]上述的方法,其中:
[0023]用归一化函数处理所述融合特征,得到一个表征了所述反应中心的评分。
[0024]上述的方法,其中:
[0025]变分量子线路的一对线路包括第一和第二线路;
[0026]第一线路中:其前级泡利旋转门的角度参数含一个节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重;
[0027]第二线路中:其前级泡利旋转门的角度参数含另一节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重。
[0028]本申请一种解决逆合成中产物反应中心预测的方法,包括以下步骤:
[0029]S1、构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图;
[0030]S2、在所述第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义出连线关系,将每个边的特征存储在预设维度的矩阵中;
[0031]S3、反应中心包括从不同反应物对应的不同第一类无向图中选定的一组节点以及该一组被选定的节点之间的边,反应中心编码成量子数据后由变分量子线路进行演化;
[0032]S4、通过矩阵叉乘的方式,聚合任一节点涉及到的边的经典数据,得到该任一节点的更新后的信息;
[0033]S5、执行多次S3

S4后,计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征,用归一化函数处理所述融合特征,得到表征所述反应中心的评分,其中评分最高的一个所述反应中心作为最终的反应中心。
[0034]随着量子计算的出现,本申请提出一种实现逆合成中产物反应中心预测的方法。
[0035]本申请具有以下优势:
[0036]基于量子比特的数据表达能力更优,例如用有向或无向图的形式表达节点特征且这种表达过程中混合了量子数据的运算,能够更精准的对节点性质进行预测。在给定一些已知节点的情况之下,可预测其整体或者聚合团所具有的性质。
[0037]量子图神经网络算法可在量子计算设备和量子芯片上高度并行处理数据特征,非阻塞式的并行处理能力比传统的阻塞式串行处理强得多,呈指数级增长。
[0038]量子图神经网络算法的量子

经典混合算法/全量子算法相比经典算法均具有更广泛的应用场景,节点数量和边连接关系具有非常大的灵活配置自由度。
[0039]基于参数化量子线路的模型训练过程中能更快收敛至稳定状态,尤其是量子线路的参数是旋转门的旋转角度等容易更新和训练的对象。
[0040]和传统的预测方法相比,本专利技术使得需要训练的参数量大大减少;用到的存储介质也即量子比特数目也大大减少;基于参数化量子线路的模型,其在训练过程中能够更快迭代至最佳状态。与此同时,该预测方法算法可在量子计算设备和量子芯片等量子硬件上高度和并行的处理数据特征,比经典算法拥有更高水准的算力。
[0041本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种解决逆合成中产物反应中心预测的方法,其特征在于,包括:构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图,对所述目标分子实施反应中心的预测,利用所述反应中心以推测出所述反应物;所述反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。2.根据权利要求1所述的方法,其特征在于:由不同反应物对应的诸多所述第一类无向图合成一个完整的所述第二类无向图。3.根据权利要求2所述的方法,其特征在于:在所述第二类无向图中计算完所有所述反应中心的评分后,选择评分最高的一个所述反应中心来定义出所述目标分子的最终断键位置处。4.根据权利要求1所述的方法,其特征在于:在所述第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义连线关系,籍此构建所述第二类无向图的图结构。5.根据权利要求1所述的方法,其特征在于:利用预设的变分量子线路聚合所述反应中心的节点特征数据和边特征数据,经过变分量子线路的演化后得到量子数据以及测量出对应的经典数据。6.根据权利要求5所述的方法,其特征在于:通过矩阵叉乘的方式,聚合每一个节点所涉及到的边的经典数据,得到该任一节点的更新后的信息。7.根据权利要求6所述的方法,其特征在于:在多次迭代各个节点的信息之后,计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征。8.根据权利要求7所述的方法,其特征在于:用...

【专利技术属性】
技术研发人员:王诗瑜赵翔
申请(专利权)人:上海图灵智算量子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1