一种化学反应产率预测方法及电子设备技术

技术编号:39599581 阅读:14 留言:0更新日期:2023-12-03 19:59
本发明专利技术涉及化学反应产率预测技术领域,具体公开了一种化学反应产率预测方法及电子设备,方法包括:构造实例化模型;对样本数据编码生成反应向量;获取一个超参数组合并对实例化模型进行初始化得到初始化模型;将反应向量输入初始化模型进行运算并获得模型参数,以及获得对应的评价指标;将评价指标向超参数调整工具报告;按照初始化模型对应的评价指标筛选出优秀模型;根据优秀模型的超参数组合以及模型参数对该模型进行保存

【技术实现步骤摘要】
一种化学反应产率预测方法及电子设备


[0001]本专利技术涉及化学反应产率预测
,尤其涉及一种化学反应产率预测方法及电子设备


技术介绍

[0002]为了提高化学反应产率的预测准确度,以便优化反应条件

提高产率和降低成本,化学反应产率预测模型训练系统应运而生

化学反应产率预测模型训练系统可以解决以下问题:
[0003]1.
降低成本:通过预测反应产率,可以更好地选择最优的反应条件,从而降低反应成本,使得化学合成更加经济;通过预测反应产率,可以减少试错成本,提高化学实验的效率,减少化学实验中的失败率,从而节省时间和成本;
[0004]2.
提高产率:通过优化反应条件,催化剂

配体的选择等,从而提高反应产率,使得化学合成过程更加高效

[0005]现有的构造产率预测模型的方法及产率预测方法利用随机森林算法来预测产率,同时根据训练数据中可能影响产率的多个因素,通过因素映射模块将这些因素映射到多个因素集中,并通过模型构造模块将处理后的训练数据和权重构造成随机森林模型

[0006]但是现有的方式存在
(1)
反应物

产物及反应条件的描述符单一;
(2)
使用的机器学习模型
——
随机森林模型的精度有限;
(3)
机器学习模型的超参数对模型性能影响较大,而人工调节超参数效率低

[0007]因此,本领域人员亟需寻找一种新的技术方案来解决上述的问题


技术实现思路

[0008]针对现有技术中的技术问题,本专利技术提供一种化学反应产率预测方法及电子设备

[0009]本专利技术包括一种化学反应产率预测方法,方法包括:
[0010]获取用户的配置信息,并根据配置信息构造实例化模型;
[0011]读取化学产率的样本数据,并按照预设的反应向量生成策略对样本数据编码生成反应向量;
[0012]从预设的超参数调整工具中获取一个超参数组合,并根据该超参数组合对实例化模型进行初始化,得到初始化模型;
[0013]将反应向量输入初始化模型进行运算并获得模型参数,以及根据预设的评价策略获得对应的评价指标;
[0014]将评价指标向超参数调整工具报告;
[0015]从超参数调整工具中再次获取一个超参数组合,并执行后续步骤,直至达到预设停止条件;
[0016]按照预设的模型筛选策略以及获得的初始化模型对应的评价指标,筛选出优秀模
型;
[0017]根据优秀模型的超参数组合以及模型参数对该模型进行保存

[0018]进一步的,获取用户的配置信息,并根据配置信息构造实例化模型,包括:
[0019]从项目文件夹中的设定路径下读入用户的配置信息;配置信息至少包括模型名称

训练模型的个数
N、
训练时长;
[0020]根据配置信息中的模型名称,从项目文件夹中读取模型数据,以及获取对应模型的超参数搜索空间

[0021]进一步的,读取化学产率的样本数据,并按照预设的反应向量生成策略对样本数据编码生成反应向量;包括:
[0022]读取样本数据,并将样本数据按照设定比例划分为训练样本集和测试样本集;训练样本集和测试样本集中均包含反应物

产物以及反应条件;
[0023]按照反应向量生成策略对训练样本集和测试样本集中的反应物

产物以及反应条件依次编码,生成每个样本数据对应的反应向量

[0024]进一步的,从预设的超参数调整工具中获取一个超参数组合时,超参数组合,为超参数调整工具通过预设的搜索算法在遍历超参数搜索空间之后寻找出的最优参数集;或,超参数组合,为超参数调整工具通过预设的搜索算法并结合评价指标在遍历超参数搜索空间之后寻找出的最优参数集

[0025]进一步的,将反应向量输入初始化模型进行运算并获得模型参数,以及根据预设的评价策略获得对应的评价指标;包括:
[0026]将训练集反应向量输入初始化模型中进行训练,得到模型参数;
[0027]根据模型参数生成训练模型;
[0028]将测试集反应向量输入训练模型中进行测试,获得预测结果;
[0029]根据评价策略以及测试集反应向量

预测结果对训练模型进行评价,得到评价指标

[0030]进一步的,根据评价策略以及测试集反应向量

预测结果对训练模型进行评价,得到评价指标,包括:
[0031]当训练模型为分类模型时,
[0032]计算模型准确率其中,
TP
表示真实情况为正例

预测结果也为正例的真正例数量,
FN
表示真实情况为正例

预测结果为反例的假反例数量,
FP
表示真实情况为反例

预测结果为正例的假正例数量,
TN
表示真实情况为反例

预测结果也为反例的真反例数量;
[0033]计算模型查准率
[0034]计算模型查全率
[0035]计算模型性能参数其中,
P
表示模型查准率
Precision

R
表示模型查全率
Recall

[0036]计算模型
AUC
值:其中,
pred
pos
表示预测结果为正例的数量,
pred
neg
表示预测结果为反例的数量;
pos
num
表示真实情况为正例的个数;
neg
num
表示真实情况为反例的个数

[0037]进一步的,根据评价策略以及测试集反应向量

预测结果对训练模型进行评价,得到评价指标,包括:
[0038]当训练模型为回归模型时,
[0039]计算模型的平均绝对误差其中,
y
i
表示第
i
个样本的预测标签值,表示第
i
个样本的真实标签值;
n
表示样本的总数;
[0040]计算模型的最大误差
[0041]计算模型的均方根误差
[0042]计算模型的决定系数其中,表示
n
个真实标签的平均值;
[0043]计算模型的皮尔逊相关系数
x

y
分别表示真实结果的值和预测结果的值;
m
x

m
y
分别表示和
y
的均值;
[0044]计本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种化学反应产率预测方法,其特征在于,所述方法包括:获取用户的配置信息,并根据所述配置信息构造实例化模型;读取化学产率的样本数据,并按照预设的反应向量生成策略对所述样本数据编码生成反应向量;从预设的超参数调整工具中获取一个超参数组合,并根据该超参数组合对所述实例化模型进行初始化,得到初始化模型;将所述反应向量输入所述初始化模型进行运算并获得模型参数,以及根据预设的评价策略获得对应的评价指标;将所述评价指标向所述超参数调整工具报告;从所述超参数调整工具中再次获取一个超参数组合,并执行后续步骤,直至达到预设停止条件;按照预设的模型筛选策略以及获得的初始化模型对应的评价指标,筛选出优秀模型;根据所述优秀模型的超参数组合以及模型参数对该模型进行保存
。2.
如权利要求1所述的一种化学反应产率预测方法,其特征在于,获取用户的配置信息,并根据所述配置信息构造实例化模型,包括:从项目文件夹中的设定路径下读入用户的配置信息;所述配置信息至少包括模型名称

训练模型的个数
N、
训练时长;根据所述配置信息中的模型名称,从项目文件夹中读取模型数据,以及获取对应模型的超参数搜索空间
。3.
如权利要求2所述的一种化学反应产率预测方法,其特征在于,读取化学产率的样本数据,并按照预设的反应向量生成策略对所述样本数据编码生成反应向量;包括:读取样本数据,并将所述样本数据按照设定比例划分为训练样本集和测试样本集;所述训练样本集和所述测试样本集中均包含反应物

产物以及反应条件;按照所述反应向量生成策略对所述训练样本集和所述测试样本集中的反应物

产物以及反应条件依次编码,生成每个样本数据对应的反应向量
。4.
如权利要求3所述的一种化学反应产率预测方法,其特征在于,从预设的超参数调整工具中获取一个超参数组合时,所述超参数组合,为所述超参数调整工具通过预设的搜索算法在遍历所述超参数搜索空间之后寻找出的最优参数集;或,所述超参数组合,为所述超参数调整工具通过预设的搜索算法并结合所述评价指标在遍历所述超参数搜索空间之后寻找出的最优参数集
。5.
如权利要求4所述的一种化学反应产率预测方法,其特征在于,将所述反应向量输入所述初始化模型进行运算并获得模型参数,以及根据预设的评价策略获得对应的评价指标;包括:将所述训练集反应向量输入所述初始化模型中进行训练,得到所述模型参数;根据所述模型参数生成训练模型;将所述测试集反应向量输入所述训练模型中进行测试,获得预测结果;根据所述评价策略以及所述测试集反应向量

所述预测结果对所述训练模型进行评价,得到所述评价指标
。6.
如权利要求5所述的一种化学反应产率预测方法,其特征在于,根据所述评价策略以
及所述测试集反应向量

所述预测结果对所述训练模型进行评价,得到所述评价指标,包括:当所述训练模型为分类模型时,计算模型准确率其中,
TP
表示真实情况为正例

预测结果也为正例的真正例数量,
FN
表示真实情况为正例<...

【专利技术属性】
技术研发人员:杨昊澎
申请(专利权)人:广州标智未来科学技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1