【技术实现步骤摘要】
本专利技术涉及产率预测领域,尤其涉及一种产率预测方法、装置及电子设备。
技术介绍
1、碳碳、碳杂键偶联以及手性的构建在药物化学中非常重要,常规方法需要用到贵金属催化并加热,具有较大能量损耗,利用光催化可以更绿色地合成药物中间体。相对于研究反应机理或用实验设计(doe)分析影响因素等传统方法,利用ai并结合计算化学技术不仅可以对反应进行系统性研究、了解影响反应效果(转化率及立体选择性)的因素,还能够利用模型加快解决实际应用中的问题,推进光化学反应的应用。
2、然而,现有的技术方案构建机器学习模型往往需要海量真实数据进行模型训练,因为海量数据中往往正确的数据占比更重,模型可以从海量数据中学习知识并忽略其中的错误数据。在当前反应类型小数据集的背景下,实验室累计的少量数据很容易会由于手动录入错误或实验误差导致错误产生,模型学习到错误的知识,会在预测时产生偏差。
3、机器学习模型常规数据清洗方法往往是删除缺失值最多的列,或者将预处理后的数据集转换为张量格式等简单的常规操作,或者将海量数据直接丢给模型进行学习,因为在数据量足
...【技术保护点】
1.一种产率预测方法,其特征在于,包括:
2.根据权利要求1所述的产率预测方法,其特征在于,在利用预设开源工具包Rdkit转换所述原始反应样本数据为矢量指纹数据之前,所述方法还包括:
3.根据权利要求2所述的产率预测方法,其特征在于,所述利用预设开源工具包Rdkit转换所述原始反应样本数据为矢量指纹数据,根据所有矢量指纹数据以及每一矢量指纹数据对应的样本产率构建样本数据集,包括:
4.根据权利要求1所述的产率预测方法,其特征在于,所述对于任一训练测试集,根据所述测试集中每一矢量指纹数据的产率预测结果确定所述矢量指纹数据的预测能力,包
5...
【技术特征摘要】
1.一种产率预测方法,其特征在于,包括:
2.根据权利要求1所述的产率预测方法,其特征在于,在利用预设开源工具包rdkit转换所述原始反应样本数据为矢量指纹数据之前,所述方法还包括:
3.根据权利要求2所述的产率预测方法,其特征在于,所述利用预设开源工具包rdkit转换所述原始反应样本数据为矢量指纹数据,根据所有矢量指纹数据以及每一矢量指纹数据对应的样本产率构建样本数据集,包括:
4.根据权利要求1所述的产率预测方法,其特征在于,所述对于任一训练测试集,根据所述测试集中每一矢量指纹数据的产率预测结果确定所述矢量指纹数据的预测能力,包括:
5.根据权利要求4所述的产率预测方法,其特征在于,所述根据所述产率偏差值以及预设偏差值,确定所述矢量指纹数据的预测能力,包括:
【专利技术属性】
技术研发人员:王正权,沈国文,孙丽霞,杨弘宾,夏宁,
申请(专利权)人:武汉智化科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。