当前位置: 首页 > 专利查询>河南大学专利>正文

基于拓扑机器学习的有机化学合成智能分析方法技术

技术编号:37150443 阅读:25 留言:0更新日期:2023-04-06 22:05
本发明专利技术提出了一种基于拓扑机器学习的有机化学合成智能分析方法,包括:拓扑特征的获取:通过拓扑数据分析对三维结构描述符进行拓扑不变量的提取,获取拓扑特征,并将三维结构描述符与拓扑特征级联;智能预测:通过LightGBM算法对级联后的特征进行训练和预测,利用网格搜索法获取LightGBM算法的最佳参数以得到LightGBM模型,并利用LightGBM模型预测化学反应产率;产率和反应条件的相关性分析:根据化学反应产率利用拓扑数据分析对级联后的特征进行聚类分析,挖掘出产率和反应条件之间的关系。本发明专利技术能自动且高效的对有机化学反应产率进行智能预测,能深层次挖掘产率和反应条件之间的内在关系,为用户提供可靠的决策信息,加速了化学研发过程。加速了化学研发过程。加速了化学研发过程。

【技术实现步骤摘要】
基于拓扑机器学习的有机化学合成智能分析方法


[0001]本专利技术涉及基于应用数学和人工智能的有机化学合成
,特别是指一种基于拓扑机器学习的有机化学合成智能分析方法。

技术介绍

[0002]偶联反应在有机化学合成中十分重要,其产物广泛应用于医药、农药、天然产物甚至先进的功能材料,氨基酸结合成蛋白质的反应也是偶联反应。在过去的几十年里,过渡金属催化的偶联反应迅猛发展,其中钯(Pd)催化的交叉偶联反应是其应用的一大类,该类反应效率较高、选择性好、反应条件温和,是现代有机合成的有效手段。
[0003]一些复杂且重要的药物分子、有机材料在制造过程中需要通过化学反应将碳原子结合在一起,然而有机化合物中碳原子成键相对较稳定,很难与其它分子直接发生化学反应,一些方法虽然能使碳原子变得更加活跃,但也会产生大量的副产物,不仅效率低还可能造成一定的污染。而用钯催化剂一定程度上就可以解决这个问题,钯原子会把不同的碳原子吸引过来,使得碳原子之间的距离变得更近、更容易结合,即为“偶联”。这样就不需要把碳原子激活到非常活跃的程度,对应产生的副产物也会比较少,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于拓扑机器学习的有机化学合成智能分析方法,其特征在于,其步骤如下:步骤一:拓扑特征的获取:通过拓扑数据分析对三维结构描述符进行拓扑不变量的提取,获取拓扑特征,并将三维结构描述符与拓扑特征级联;步骤二:智能预测:通过LightGBM算法对级联后的特征进行训练和预测,利用网格搜索法获取LightGBM算法的最佳参数以得到LightGBM模型,并利用LightGBM模型预测化学反应产率;步骤三:产率和反应条件的相关性分析:根据化学反应产率利用拓扑数据分析对级联后的特征进行聚类分析,挖掘出产率和反应条件之间的关系。2.根据权利要求1所述的基于拓扑机器学习的有机化学合成智能分析方法,其特征在于,步骤一的实现方法为:S1.1、将三维结构描述符导入到拓扑数据分析中生成持续性图,然后通过相关方法矢量化持续性图,输出拓扑特征;S1.2、将三维结构描述符和拓扑特征级联,并将级联后的特征与产率一一对应后分为训练集和测试集。3.根据权利要求1所述的基于拓扑机器学习的有机化学合成智能分析方法,其特征在于,步骤S1.1中拓扑结构的具体计算过程为:S1.1.1、将三维描述符信息导入到拓扑数据分析算法中,将其中的拓扑信息转化为持续性图;S1.1.2、通过持续性图来记录每一个拓扑不变量的变化;其中,持续性图是将持续同调分析的结果表示为成对的诞生时间和消亡时间,横轴和表示的是拓扑不变量的诞生时的过滤值,纵轴表示的是拓扑不变量的消亡时的过滤值,用b
α
记录每一个拓扑不变量在过滤轴上诞生的位置,用d
α
记录每一个拓扑不变量在过滤轴上消亡的位置,则p
α
=d
α

b
α
表示每一个拓扑不变量的生存周期;S1.1.3、通过对持续性图的矢量化获取拓扑特征:连接组件H0、循环结构H1和空洞结构H2的真实持续存在的数量、连接组件H0、循环结构H1和空洞结构H2的平均生存期及持续熵;其中,持续熵D={(b
α
,d
α
)}
α∈A
,持续熵D是根据计算得到的,4.根据权利要求2所述的基于拓扑机器学习的有机化学合成智能分析方法,其特征在于,所述Light...

【专利技术属性】
技术研发人员:李谦郭艳慧王岩彭李超杨晓慧
申请(专利权)人:河南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1