基于机器学习与自动化试验装置的操作步骤的生成方法制造方法及图纸

技术编号:34744096 阅读:30 留言:0更新日期:2022-08-31 18:37
本公开涉及基于机器学习与自动化试验装置的操作步骤的生成方法。包括:获取化学反应式中各物质的分子图特征矩阵、分子图邻接矩阵和分子指纹特征;将所述分子图特征矩阵和所述分子图邻接矩阵输入至操作步骤预测模型,得到所述化学反应式对应的操作步骤。本公开实施例能够自动的预测化学反应对应的操作步骤,更进一步的,本公开还开发了优化系统以及实验室自动化平台,能够实现通过机器学习算法进行初始预测,实验室自动化平台进行验证,机器学习算法进行进一步优化的自循环预测优化系统。减少了人工测试的偶然性,提高了操作步骤的准确性。性。性。

【技术实现步骤摘要】
基于机器学习与自动化试验装置的操作步骤的生成方法


[0001]本公开涉及人工智能
,尤其涉及基于机器学习与自动化试验装置的化学反应操作步骤的生成方法、装置及系统。

技术介绍

[0002]在目标化合物的生成过程中,不仅需要明确反应物、反应条件(例如催化剂、反应温度、反应时间等)、反应路径(例如反应物A和反应物B在反应条件C下生成中间体D,中间体D和反应物E在反应条件F下生成生成物G),还需要明确化学反应操作步骤(例如加料、反应、搅拌、过滤、结晶等)。相关技术中,化学反应操作步骤的确定多依赖于人工实现,人工结合文献和自身经验,通过不断地试错试验确定操作步骤,不仅费时费力,而且测试极具偶然性。

技术实现思路

[0003]为克服相关技术中存在的至少一个问题,本公开一种基于机器学习与自动化试验装置的化学反应操作步骤的生成方法、装置及系统。
[0004]根据本公开实施例的第一方面,提供一种化学反应操作步骤的生成方法,包括:
[0005]获取化学反应式中各物质的分子图特征矩阵、分子图关系结构信息和分子指纹特征;
[0006]将所述分子图特征矩阵和所述分子图关系结构信息输入至操作步骤预测模型,输出所述化学反应式对应的初始操作步骤;
[0007]将所述分子指纹特征输入至投料顺序预测模型,输出所述化学反应式中的物质的投料顺序;
[0008]根据所述投料顺序,将各所述物质匹配到所述初始操作步骤中,得到所述化学反应式对应的操作步骤;
[0009]利用自动化试验装置及预设优化算法对所述多组操作步骤进行筛选,确定最优的操作步骤。
[0010]在一种可能的实现方式中,所述获取化学反应式中各物质的分子图特征矩阵,包括:
[0011]获取化学反应式中物质的分子图的原子特征及化学键特征;
[0012]根据所述原子特征及所述化学键特征,确定各所述物质的分子图特征矩阵。
[0013]在一种可能的实现方式中,获取化学反应式中各物质的分子图关系结构信息,包括:
[0014]获取化学反应式中物质的分子图节点的连接关系;
[0015]根据所述连接关系,确定各所述物质的分子图关系结构信息。
[0016]在一种可能的实现方式中,所述操作步骤预测模型包括编码器和解码器,所述将所述分子图特征矩阵和所述分子图关系结构信息输入至操作步骤预测模型,输出所述化学
反应式对应的初始操作步骤,包括:
[0017]将所述各物质的分子图特征矩阵、分子图关系结构信息输入至编码器,经所述编码器输出所述各物质的上下文向量;
[0018]将所述各物质的上下文向量输入至所述解码器,输出所述化学反应式对应的初始操作步骤。
[0019]在一种可能的实现方式中,所述物质包括反应物、条件物和生成物;所述将所述各物质的分子图特征矩阵、分子图关系结构信息输入至编码器,经所述编码器输出所述各物质的上下文向量,包括:
[0020]分别获取所述反应物的上下文向量、所述条件物的上下文向量以及所述生成物的上下文向量;
[0021]将所述反应物的上下文向量与所述条件物的上下文向量进行相加处理,得到中间向量;
[0022]合并所述中间向量与所述生成物的上下文向量,得到所述化学反应式的上下文向量。
[0023]在一种可能的实现方式中,所述解码器包括GRU网络解码器,所述将所述上下文向量输入至所述解码器,输出所述化学反应式对应的初始操作步骤,包括:
[0024]将预设开始词符的词向量以及所述上下文向量输入至GRU网络解码器的第一个GRU单元,输出第一预测词符的词向量及第一隐状态,其中,所述GRU网络解码器包括多个GRU单元;
[0025]将所述第一预测词符的词向量及所述第一隐状态输入下一个GRU单元,直到输入预设结束词符的词向量或预测词符的长度达到预设值,得到所述化学反应式对应的初始操作步骤。
[0026]在一种可能的实现方式中,所述操作步骤预测模型的训练方式包括:
[0027]获取第一样本集合,所述第一样本集合包括标注有操作步骤类别的第一化学反应式样本;
[0028]获取所述第一化学反应式样本中的物质的分子图特征矩阵样本和分子图关系结构信息样本;
[0029]将所述分子图特征矩阵样本和所述分子图关系结构信息样本输入至初始操作步骤预测模型,生成预测结果;
[0030]基于预测结果与标注的操作步骤类别之间的差异,对所述初始操作步骤预测模型中的训练参数进行迭代调整,直至满足预设要求,得到操作步骤预测模型。
[0031]在一种可能的实现方式中,所述投料顺序预测模型的训练方式包括:
[0032]获取第二样本集合,所述第二样本集合包括第二化学反应式样本,所述第二化学反应式样本中的物质标注有投料顺序;
[0033]获取所述第二化学反应式样本中的物质的分子指纹特征样本;
[0034]将所述分子指纹特征样本输入至初始投料顺序预测模型,生成预测结果;
[0035]基于预测结果与标注的投料顺序之间的差异,对所述初始投料顺序预测模型中的训练参数进行迭代调整,直至满足预设要求,得到投料顺序预测模型。
[0036]在一种可能的实现方式中,在所述根据所述投料顺序,所述利用自动化试验装置
及预设优化算法对所述多组操作步骤进行筛选,确定最优的操作步骤,包括:
[0037]针对所述多组操作步骤中的每组操作步骤,获取由自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果;
[0038]根据多个反应结果及预设优化算法,从所述多组操作步骤中确定最优的操作步骤。
[0039]在一种可能的实现方式中,所述针对所述多组操作步骤中的每组操作步骤,获取由自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果,
[0040]针对所述多组操作步骤中的每组操作步骤,将所述每组操作步骤转换为自动化试验装置识别的指令信息,所述指令信息用于指示所述自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果。
[0041]在一种可能的实现方式中,所述预设优化算法包括贝叶斯优化模型,所述反应结果包括产物的产率或纯度,所述根据多个反应结果及预设优化算法,从所述多组操作步骤中确定最优的操作步骤,包括:
[0042]将所述组操作步骤输入至初始化代理模型,经所述初始化代理模型拟合得到产物的产率或纯度,所述代理模型用于表示先验分布;
[0043]基于采集函数在所述先验分布上的结果,选择备选试验的组操作步骤;其中,所述采集函数用于基于所述初始化代理模型给出的均值和方差,确定探索新的组操作步骤组合或利用已经得到过实验值的组操作步骤;
[0044]利用自动化试验装置按照所述备选试验的组操作步骤进行试验,得到真实的产物的产率或纯度;
[0045]利用所述真实本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于机器学习与自动化试验装置的化学反应操作步骤的生成方法,其特征在于,包括:获取化学反应式中各物质的分子图特征矩阵、分子图关系结构信息和分子指纹特征;将所述分子图特征矩阵和所述分子图关系结构信息输入至操作步骤预测模型,输出所述化学反应式对应的初始操作步骤;将所述分子指纹特征输入至投料顺序预测模型,输出所述化学反应式中的物质的投料顺序;根据所述投料顺序,将各所述物质匹配到所述初始操作步骤中,得到所述化学反应式对应的多组操作步骤;利用自动化试验装置及预设优化算法对所述多组操作步骤进行筛选,确定最优的操作步骤。2.根据权利要求1所述的方法,其特征在于,所述获取化学反应式中各物质的分子图特征矩阵,包括:获取化学反应式中物质的分子图的原子特征及化学键特征;根据所述原子特征及所述化学键特征,确定各所述物质的分子图特征矩阵。3.根据权利要求1所述的方法,其特征在于,获取化学反应式中各物质的分子图关系结构信息,包括:获取化学反应式中物质的分子图节点的连接关系;根据所述连接关系,确定各所述物质的分子图关系结构信息。4.根据权利要求1所述的方法,其特征在于,所述操作步骤预测模型包括编码器和解码器,所述将所述分子图特征矩阵和所述分子图关系结构信息输入至操作步骤预测模型,输出所述化学反应式对应的初始操作步骤,包括:将所述各物质的分子图特征矩阵、分子图关系结构信息输入至编码器,经所述编码器输出所述各物质的上下文向量;将所述各物质的上下文向量输入至所述解码器,输出所述化学反应式对应的初始操作步骤。5.根据权利要求4所述的方法,其特征在于,所述物质包括反应物、条件物和生成物;所述将所述各物质的分子图特征矩阵、分子图关系结构信息输入至编码器,经所述编码器输出所述各物质的上下文向量,包括:分别获取所述反应物的上下文向量、所述条件物的上下文向量以及所述生成物的上下文向量;将所述反应物的上下文向量与所述条件物的上下文向量进行相加处理,得到中间向量;合并所述中间向量与所述生成物的上下文向量,得到所述化学反应式的上下文向量。6.根据权利要求4所述的方法,其特征在于,所述解码器包括GRU网络解码器,所述将所述上下文向量输入至所述解码器,输出所述化学反应式对应的初始操作步骤,包括:将预设开始词符的词向量以及所述上下文向量输入至GRU网络解码器的第一个GRU单元,输出第一预测词符的词向量及第一隐状态,其中,所述GRU网络解码器包括多个GRU单元;
将所述第一预测词符的词向量及所述第一隐状态输入下一个GRU单元,直到输入预设结束词符的词向量或预测词符的长度达到预设值,得到所述化学反应式对应的初始操作步骤。7.根据权利要求1至6中任一项所述的方法,其特征在于,所述操作步骤预测模型的训练方式包括:获取第一样本集合,所述第一样本集合包括标注有操作步骤类别的第一化学反应式样本;获取所述第一化学反应式样本中的物质的分子图特征矩阵样本和分子图关系结构信息样本;将所述分子图特征矩阵样本和所述分子图关系结构信息样本输入至初始操作步骤预测模型,生成预测结果;基于预测结果与标注的操作步骤类别之间的差异,对所述初始操作步骤预测模型中的训练参数进行迭代调整,直至满足预设要求,得到操作步骤预测模型。8.根据权利要求1至6中任一项所述的方法,其特征在于,所述利用自动化试验装置及预设优化算法对所述多组操作步骤进行筛选,确定最优的操作步骤,包括:针对所述多组操作步骤中的每组操作步骤,获取由自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果;根据多个反应结果及预设优化算法,从所述多组操作步骤中确定最优的操作步骤。9.根据权利要求8所述的方法,其特征在于,所述针对所述多组操作步骤中的每组操作步骤,获取由自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果,针对所述多组操作步骤中的每组操作步骤,将所述每组操作步骤转换为自动化试验装置识别的指令信息,所述指令信息用于指示所述自动化试验装置按照所述组操作步骤,对所述化学反应式中的物质进行化学反应操作,得到对应的反应结果。10.根据权利要求8所述的方法,其特征在于,所述预设优化算法包括贝叶斯优化模型,所述反应结果包括产物的产率或纯度,所述根据多个反应结果及预设优化算法,从所述多组操作步骤中确定最优的操作步骤,包括:将所述组操作步骤输入至初始化代理模型,经所述初始化代理模型拟合得到产物的产率或纯度,所述代理模型用于表示先验分布;基于采集函数在所述先验分布上的结果,选择备选试验的组操作步骤;其中,所述采集函数用于基于所述初始化代理模型给出的均值和方差,确定探索新的组操作步骤组合或利用已经得到过实验值的组操作步骤;利用自动化试验装置按照所述备选试验的组操作步骤进行试验,得到真实的产物的产率或纯度;利用所述真实的产物的产率或纯度更新所述代理模型的先验分布,得到后验分布;重复执行利用后验分布的数据更新先验分布的数据过程,直到所述真实的产物或纯度满足预设要求。11.一种基于机器学习与自动化试验装置的化学反应操作步骤的生成方法装置,其特征在于,包括:
第一获取模块,用于获取化学反应式中各物质的分子图特征矩阵、分子图关系结构信息和分子指纹特征;第一预测模块,用于将所述分子图特征矩阵和所述分子图关系结构信息输入至操作步骤预测模型,输出所述化学反应式对应的初始操作步骤;第二预测模块,用于将所述分子指纹特征输入至投料顺序预测模型,输出所述化学反应式中的物质的投料顺序;...

【专利技术属性】
技术研发人员:吴海超曾琢吴静巍陆文洋公维博杨承颖
申请(专利权)人:苏州沃时数字科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1