基于机器学习的开环聚合焓预测方法和装置制造方法及图纸

技术编号:38634970 阅读:17 留言:0更新日期:2023-08-31 18:31
本发明专利技术公开了一种基于机器学习的开环聚合焓预测方法和装置,属于人工智能领域,所述方法包括:获取待预测聚合物的结构数据文件,并根据所述结构数据文件生成描述符;将所述描述符输入预先训练的聚合焓预测模型,即可得到所述待预测聚合物的开环聚合焓;从而解决了现有技术中开环聚合焓的预测准确性较差,计算速度较低的技术问题。度较低的技术问题。度较低的技术问题。

【技术实现步骤摘要】
基于机器学习的开环聚合焓预测方法和装置


[0001]本专利技术涉及人工智能
,具体涉及一种基于机器学习的开环聚合焓预测方法和装置。

技术介绍

[0002]为了实现塑料的重复利用,一个有效的方式是提纯和在再聚合之前将聚合物废物解聚为单体。化学回收方法让聚合物能有效地解聚,这类聚合物通过开环单体产生的聚合物,把开环聚合(ROP)焓ΔHROP作为环状单体聚合的热力学性质指标。
[0003]为了预测开环聚合焓,在一个现有技术中,基于第一性原理计算方法,采用优化的单体、诱发剂的基态原子构型预测ΔHROP,这对设计可解聚聚合物有参考意义但限于其是一种定性理解方法,不能给出定量建议而不能指导实验。在另一个现有技术中,利用密度泛函理论对构型空间进行广泛采样,但由于分子动力模拟的复杂度高,聚合焓的预测精度较差,计算速度较低。
[0004]因此,提供一种基于机器学习的开环聚合焓预测方法和装置,以期能够提高开环聚合焓的预测准确性和计算速度,就成为本领域技术人员亟待解决的问题。

技术实现思路

[0005]为此,本专利技术实施例提供了一种基于机器学习的开环聚合焓预测方法和装置,以解决现有技术中开环聚合焓的预测准确性较差,计算速度较低的技术问题。
[0006]为了实现上述目的,本专利技术实施例提供如下技术方案:本专利技术提供了一种基于机器学习的开环聚合焓预测方法,所述方法包括:获取待预测聚合物的结构数据文件,并根据所述结构数据文件生成描述符;将所述描述符输入预先训练的聚合焓预测模型,以得到所述待预测聚合物的开环聚合焓;其中,所述聚合焓预测模型是以随机森林回归模型的回归评价数据作为结果、利用开环聚合焓数据样本进行训练得到的。
[0007]在一些实施例中,根据所述结构数据文件生成描述符,具体包括:在所述结构数据文件中提取SMILES描述符;利用分子指纹算法,将所述SMILES描述符转换为二维描述符或三维描述符。
[0008]在一些实施例中,以随机森林回归模型的回归评价数据作为结果、利用开环聚合焓数据样本进行训练得到所述聚合焓预测模型,具体包括:分别获取各开环聚合焓数据样本的结构数据文件,提取各结构数据文件的SMILES描述符,并利用各开环聚合焓数据样本的SMILES描述符构建数据集;将数据集划分为训练集与测试集;基于随机森林回归模型,利用所述训练集中的开环聚合焓数据样本的SMILES描述符进行回归建模,并得到回归评价数据;
标准化训练集数据;以回归评价数据为结果,以各开环聚合焓数据样本的SMILES描述符为自变量,基于训练集训练所述回归模型,以得到聚合焓预测模型。
[0009]在一些实施例中,提取各结构数据文件的SMILES描述符,之后还包括:利用分子指纹算法,将所述SMILES描述符转换为二维描述符或三维描述符。
[0010]在一些实施例中,基于随机森林回归模型,利用所述训练集中的开环聚合焓数据样本的SMILES描述符进行回归建模,具体包括:在所述训练集中随机抽取样本和特征,构建多个互不关联的决策树;利用多个决策树通过并行的方式获得预测结果;将多个决策树的预测结果进行平均或加权平均,从而得到最终回归结果。
[0011]在一些实施例中,所述结构数据文件至少包括数据文件单元、注释列、预先设置的目标变量y和用于生成SMILES描述符的结构数据单元。
[0012]在一些实施例中,利用分子指纹算法,将所述SMILES描述符转换为二维描述符或三维描述符,具体包括:将结构数据文件中的分子结构编码为结构化数据,并转变成固定长度阵列,基于比特数描述分子中是否存在特定的子结构或基团。
[0013]本专利技术还提供一种基于机器学习的开环聚合焓预测装置,所述装置包括:数据获取单元,用于获取待预测聚合物的结构数据文件,并根据所述结构数据文件生成描述符;结果生成单元,用于将所述描述符输入预先训练的聚合焓预测模型,以得到所述待预测聚合物的开环聚合焓;其中,所述聚合焓预测模型是以随机森林回归模型的回归评价数据作为结果、利用开环聚合焓数据样本进行训练得到的。
[0014]本专利技术还提供了一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时实现如上所述方法的步骤。
[0015]本专利技术还提供了一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。
[0016]本专利技术所提供的基于机器学习的开环聚合焓预测方法和装置,通过获取待预测聚合物的结构数据文件,并根据所述结构数据文件生成描述符;将所述描述符输入预先训练的聚合焓预测模型,即可得到所述待预测聚合物的开环聚合焓;从而解决了现有技术中开环聚合焓的预测准确性较差,计算速度较低的技术问题。
附图说明
[0017]为了更清楚地说明本专利技术的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引伸获得其它的实施附图。
[0018]本说明书所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供
熟悉此技术的人士了解与阅读,并非用以限定本专利技术可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本专利技术所能产生的功效及所能达成的目的下,均应仍落在本专利技术所揭示的
技术实现思路
得能涵盖的范围内。
[0019]图1为本专利技术所提供的基于机器学习的开环聚合焓预测方法的流程图之一;图2为本专利技术所提供的基于机器学习的开环聚合焓预测方法的流程图之二;图3为本专利技术所提供的基于机器学习的开环聚合焓预测方法的流程图之三;图4为本专利技术所提供预测方法中特征描述符与重要性的对应图;图5为本专利技术所提供的基于机器学习的开环聚合焓预测方法的流程图之四;图6为本专利技术所提供的分子图图例之一;图7为本专利技术所提供的分子图图例之二;图8为本专利技术所提供的基于机器学习的开环聚合焓预测装置的结构框图;图9为本专利技术所提供的一种计算机设备的结构框图。
具体实施方式
[0020]以下由特定的具体实施例说明本专利技术的实施方式,熟悉此技术的人士可由本说明书所揭露的内容轻易地了解本专利技术的其他优点及功效,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0021]为了解决现有技术中存在的问题,本专利技术提出一种基于利用机器学习预测开环聚合焓的方法及装置。总的来讲,用描述符表示40余种文献中收集的聚合物单体,作为模型训练数据集,结合机器学习中随机森林回归算法实现决定系数(R2)为81%以上的聚合焓数值预测结果,封装前述模型。再使用分子生成技术,产生潜在虚拟候选新材料,使用前述训练好的随机森林模型便可快速预测出虚拟候选新材料开环聚合焓,实现设计新本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习的开环聚合焓预测方法,其特征在于,所述方法包括:获取待预测聚合物的结构数据文件,并根据所述结构数据文件生成描述符;将所述描述符输入预先训练的聚合焓预测模型,以得到所述待预测聚合物的开环聚合焓;其中,所述聚合焓预测模型是以随机森林回归模型的回归评价数据作为结果、利用开环聚合焓数据样本进行训练得到的。2.根据权利要求1所述的基于机器学习的开环聚合焓预测方法,其特征在于,根据所述结构数据文件生成描述符,具体包括:在所述结构数据文件中提取SMILES描述符;利用分子指纹算法,将所述SMILES描述符转换为二维描述符或三维描述符。3.根据权利要求1所述的基于机器学习的开环聚合焓预测方法,其特征在于,以随机森林回归模型的回归评价数据作为结果、利用开环聚合焓数据样本进行训练得到所述聚合焓预测模型,具体包括:分别获取各开环聚合焓数据样本的结构数据文件,提取各结构数据文件的SMILES描述符,并利用各开环聚合焓数据样本的SMILES描述符构建数据集;将数据集划分为训练集与测试集;基于随机森林回归模型,利用所述训练集中的开环聚合焓数据样本的SMILES描述符进行回归建模,并得到回归评价数据;标准化训练集数据;以回归评价数据为结果,以各开环聚合焓数据样本的SMILES描述符为自变量,基于训练集训练所述回归模型,以得到聚合焓预测模型。4.根据权利要求3所述的基于机器学习的开环聚合焓预测方法,其特征在于,提取各结构数据文件的SMILES描述符,之后还包括:利用分子指纹算法,将所述SMILES描述符转换为二维描述符或三维描述符。5.根据权利要求3所述的基于机器学习的开环聚合焓预测方法,其特征在于,基于随机森林回归模型,利用所述训练集中的开环聚...

【专利技术属性】
技术研发人员:李龙
申请(专利权)人:苏州创腾软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1