基于机器学习的化学通路分析预测方法及终端设备技术

技术编号:35545258 阅读:35 留言:0更新日期:2022-11-12 15:23
本申请针对现有化学反应路径预测技术中存在的设计效率慢、预测精度低等问题,提出一种基于机器学习的化学通路分析预测方法。通过四层架构:数据支撑层、数据计算层、规则网络层和路径预测层,实现对未知反应路径的快速、高精度预测。本申请基于图表征的方式构建大规模底层化学数据库,能够很好的体现化学反应中分子的结构变化;通过图卷积神经网络模型和快速子图匹配检测技术,准确地提取出化学分子特征、反应模式等信息,有效提高了通路预测的精准度。本申请借助通路预测技术,实现从反应物到目标产物在反应规则网络的快速搜索,极大提高了生物反应路径的预测效率,降低了路径预测的成本。的成本。的成本。

【技术实现步骤摘要】
基于机器学习的化学通路分析预测方法及终端设备


[0001]本专利技术属于数据挖掘和机器学习
,尤其涉及一种对化学分子的未知反应路径智能化设计与预测方法及终端设备。

技术介绍

[0002]反应路径,指反应物在酶的催化下发生一系列化学反应生成相应产物的过程。通过生物反应路径预测能帮助人们合成一些需要的目标产物,为化学医疗领域的创新研究提供有效的牵引。
[0003]现有的路径预测技术借助于大量化学实验和研究经验推算,使用的传统化学数据库无法表征出化学分子在参与反应的过程中自身结构的变化关系,在此数据库的基础上进行的路径预测研究存在分析挖掘速度慢、路径预测误差大等问题,而且容易受实验设备、实验环境等诸多因素的限制,极大制约了生物反应的设计效率和预测精度。

技术实现思路

[0004]为了解决上述传统路径预测技术中存在的问题,本专利技术提出了一种基于机器学习的化学通路分析预测方法及终端设备,可以实现对未知反应路径的快速、高精度预测。如图3所示,整体分为:
[0005](1)数据支撑层,以图表征的方式构建化学数据库,为数本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种化学分子结构的图表征方法,其特征在于,每个化学分子表征为一个无向图,使用图的节点表征一个个化学原子,使用图的无向边表征原子之间的连接。2.一种化学反应的图表征方法,其特征在于,使用有向图表征每个化学反应,图的节点表征一个化学分子,使用图的有向边表征化学分子参与反应的方向,并在反应输入端和输出端各设置一个虚拟节点,以完成对所有类型的化学反应的图表征。3.一种化学通路数据库的构建方法,其特征在于,按照权利要求1所述的分子结构图表征方法保存化学分子,按照权利要求2所述的化学反应通路图表征方法保存化学反应。4.一种针对化学分子的分析计算方法,其特征在于,使用图卷积神经网络模型开展分析计算工作,包括以下步骤:步骤1)首先针对化学物质的SMILES分子结构构建其对应的属性图;步骤2)将属性图输入到一个图卷积神经网络中,通过多个组合层(卷积层、池化层、激活层)的计算实现对图的嵌入,即完成将图由拓扑结构转换为一个d维向量的工作;步骤3)将SMILES结构中有关化学物质的其他特征向量与图神经网络嵌入后的d维向量相结合输入到特征聚合层,通过PCA实现对整个化学分子结构的特征向量的提取和聚合;步骤4)通过一个Softmax层实现对化学分...

【专利技术属性】
技术研发人员:张毅周龙飞吴振东
申请(专利权)人:中芯未来北京科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1