产率预测方法、装置及电子设备制造方法及图纸

技术编号:44310998 阅读:16 留言:0更新日期:2025-02-18 20:25
本发明专利技术提供了一种产率预测方法、装置及电子设备,涉及产率预测领域,该方法包括:转换原始反应样本数据为矢量指纹数据,根据所有矢量指纹数据以及样本产率构建样本数据集;对样本数据集进行多次随机采样,得到多个训练测试集;根据产率预测结果确定矢量指纹数据的预测能力,在矢量指纹数据的预测能力为不合格的次数超过预设次数的情况下,确定矢量指纹数据对应的原始反应样本数据为待剔除数据,剔除所有待剔除数据,得到剔除后反应样本数据;输入目标反应数据至预设产率预测模型,得到目标产率。本发明专利技术能够清洗掉异常值数据,使用剔除后反应样本数据训练预设产率预测模型,确保了模型预测的准确性和可靠性,提高模型的预测精度。

【技术实现步骤摘要】

本专利技术涉及产率预测领域,尤其涉及一种产率预测方法、装置及电子设备


技术介绍

1、碳碳、碳杂键偶联以及手性的构建在药物化学中非常重要,常规方法需要用到贵金属催化并加热,具有较大能量损耗,利用光催化可以更绿色地合成药物中间体。相对于研究反应机理或用实验设计(doe)分析影响因素等传统方法,利用ai并结合计算化学技术不仅可以对反应进行系统性研究、了解影响反应效果(转化率及立体选择性)的因素,还能够利用模型加快解决实际应用中的问题,推进光化学反应的应用。

2、然而,现有的技术方案构建机器学习模型往往需要海量真实数据进行模型训练,因为海量数据中往往正确的数据占比更重,模型可以从海量数据中学习知识并忽略其中的错误数据。在当前反应类型小数据集的背景下,实验室累计的少量数据很容易会由于手动录入错误或实验误差导致错误产生,模型学习到错误的知识,会在预测时产生偏差。

3、机器学习模型常规数据清洗方法往往是删除缺失值最多的列,或者将预处理后的数据集转换为张量格式等简单的常规操作,或者将海量数据直接丢给模型进行学习,因为在数据量足够的情况下优质数据占本文档来自技高网...

【技术保护点】

1.一种产率预测方法,其特征在于,包括:

2.根据权利要求1所述的产率预测方法,其特征在于,在利用预设开源工具包Rdkit转换所述原始反应样本数据为矢量指纹数据之前,所述方法还包括:

3.根据权利要求2所述的产率预测方法,其特征在于,所述利用预设开源工具包Rdkit转换所述原始反应样本数据为矢量指纹数据,根据所有矢量指纹数据以及每一矢量指纹数据对应的样本产率构建样本数据集,包括:

4.根据权利要求1所述的产率预测方法,其特征在于,所述对于任一训练测试集,根据所述测试集中每一矢量指纹数据的产率预测结果确定所述矢量指纹数据的预测能力,包括:

5...

【技术特征摘要】

1.一种产率预测方法,其特征在于,包括:

2.根据权利要求1所述的产率预测方法,其特征在于,在利用预设开源工具包rdkit转换所述原始反应样本数据为矢量指纹数据之前,所述方法还包括:

3.根据权利要求2所述的产率预测方法,其特征在于,所述利用预设开源工具包rdkit转换所述原始反应样本数据为矢量指纹数据,根据所有矢量指纹数据以及每一矢量指纹数据对应的样本产率构建样本数据集,包括:

4.根据权利要求1所述的产率预测方法,其特征在于,所述对于任一训练测试集,根据所述测试集中每一矢量指纹数据的产率预测结果确定所述矢量指纹数据的预测能力,包括:

5.根据权利要求4所述的产率预测方法,其特征在于,所述根据所述产率偏差值以及预设偏差值,确定所述矢量指纹数据的预测能力,包括:

【专利技术属性】
技术研发人员:王正权沈国文孙丽霞杨弘宾夏宁
申请(专利权)人:武汉智化科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1