一种化学物质合成分析方法、装置、设备及存储介质制造方法及图纸

技术编号:26794853 阅读:31 留言:0更新日期:2020-12-22 17:11
本申请公开了一种化学物质合成分析方法、装置、设备及存储介质。该方法的步骤包括:获取待分析化学物质的待分析表达式;将待分析表达式输入至合成分析模型;其中,合成分析模型至少由基于样本表达式划分得到的词向量,以及样本表达式对应的化学属性信息对神经网络模型训练得到;获取合成分析模型生成的中间分子,并基于中间分子生成待分析化学物质的合成路线信息。本方法相对降低了分析过程中的时间开销,并且相对确保了逆合成分析的整体准确性。此外,本申请还提供一种化学物质合成分析装置、设备及存储介质,有益效果同上所述。

【技术实现步骤摘要】
一种化学物质合成分析方法、装置、设备及存储介质
本申请涉及化学领域,特别是涉及一种化学物质合成分析方法、装置、设备及存储介质。
技术介绍
随着有机化学的飞速发展,合成化学的研究不断突破,合成路线的设计在化学、化工、制药、材料等多种领域中的地位变得至关重要。好的合成路线,不仅能够让化学工作人员能够快速的合成目标化合物。逆合成分析是目前有机合成路线设计的常用方法。逆合成分析是从目标分子的化学结构入手,将目标分子转化成一些稍小的中间分子,再以这些中间分子作为新的目标分子,将其拆分为成更小的中间分子,以此类推,直至中间分子是当前可制备的物质,进而逆向得到目标分子的合成路线。由于当前的逆合成分析依赖于技术人员自身的知识和经验,因此在逆合成分析过程中往往需要产生较大的时间开销,并且难以确保逆合成分析的整体准确性。由此可见,提供一种化学物质合成分析方法,以相对降低逆合成分析过程中的时间开销,并且确保逆合成分析的整体准确性,是本领域技术人员需要解决的问题。
技术实现思路
本申请的目的是提供一种化学物质合成分析方法、装置、设备及存储介质,以相对降低逆合成分析过程中的时间开销,并且确保逆合成分析的整体准确性。为解决上述技术问题,本申请提供一种化学物质合成分析方法,包括:获取待分析化学物质的待分析表达式;将待分析表达式输入至合成分析模型;其中,合成分析模型至少由基于样本表达式划分得到的词向量,以及样本表达式对应的化学属性信息对神经网络模型训练得到;获取合成分析模型生成的中间分子,并基于中间分子生成待分析化学物质的合成路线信息。优选地,合成分析模型的生成过程,包括:获取样本表达式以及样本表达式的化学属性信息;将样本表达式划分为词向量;基于包含有词向量以及化学属性信息的特征向量对神经网络模型进行训练,得到合成分析模型。优选地,在基于包含有词向量以及化学属性信息的特征向量对神经网络模型进行训练之前,方法还包括:获取生成样本表达式的化学反应方程式;提取化学反应方程式中的方程式分子信息;基于包含有词向量以及化学属性信息的特征向量对神经网络模型进行训练,包括:基于包含有词向量、化学属性信息以及方程式分子信息的特征向量对神经网络模型进行训练。优选地,方程式分子信息包括反应物分子信息、反应试剂分子信息以及反应产物分子信息。优选地,待分析表达式、样本表达式以及化学反应方程式的数据编码格式均为SMILES格式。优选地,将样本表达式划分为词向量,包括:通过词嵌入方式将样本表达式划分为词向量。优选地,神经网络模型包括循环神经网络模型。此外,本申请还提供一种化学物质合成分析装置,包括:表达式获取模块,用于获取待分析化学物质的待分析表达式;模型输入模块,用于将待分析表达式输入至合成分析模型;其中,合成分析模型至少由基于样本表达式划分得到的词向量,以及样本表达式对应的化学属性信息对神经网络模型训练得到;模型分析模块,用于获取合成分析模型生成的中间分子,并基于中间分子生成待分析化学物质的合成路线信息。此外,本申请还提供一种化学物质合成分析设备,包括:存储器,用于存储计算机程序;处理器,用于执行计算机程序时实现如上述的化学物质合成分析方法的步骤。此外,本申请还提供一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现如上述的化学物质合成分析方法的步骤。本申请所提供的化学物质合成分析方法,首先获取待分析化学物质的待分析表达式,进而将待分析表达式输入至合成分析模型,该合成分析模型至少由基于样本表达式划分得到的词向量,以及样本表达式对应的化学属性信息对神经网络模型训练得到,在将待分析表达式输入至合成分析模型后,进一步获取合成分析模型生成的中间分子,并基于中间分析生成待分析化学物质的合成路线信息。本方法通过基于样本表达式划分得到的词向量以及样本表达式的化学属性信息共同对神经网络模型训练得到的合成分析模型,取代技术人员以人工方式对待分析化学物质的逆合成分析,相对降低了分析过程中的时间开销,并且相对确保了逆合成分析的整体准确性。此外,本申请还提供一种化学物质合成分析装置、设备及存储介质,有益效果同上所述。附图说明为了更清楚地说明本申请实施例,下面将对实施例中所需要使用的附图做简单的介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请实施例公开的一种化学物质合成分析方法的流程图;图2为本申请实施例公开的一种合成分析模型的生成过程的流程图;图3为本申请实施例公开的一种化学物质合成分析装置的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下,所获得的所有其他实施例,都属于本申请保护范围。逆合成分析是目前有机合成路线设计的常用方法。逆合成分析是从目标分子的化学结构入手,将目标分子转化成一些稍小的中间分子,再以这些中间分子作为新的目标分子,将其拆分为成更小的中间分子,以此类推,直至中间分子是当前可制备的物质,进而逆向得到目标分子的合成路线。由于当前的逆合成分析依赖于技术人员自身的知识和经验,因此在逆合成分析过程中往往需要产生较大的时间开销,并且难以确保逆合成分析的整体准确性。为此,本申请的核心是提供一种化学物质合成分析方法,以相对降低逆合成分析过程中的时间开销,并且确保逆合成分析的整体准确性。为了使本
的人员更好地理解本申请方案,下面结合附图和具体实施方式对本申请作进一步的详细说明。请参见图1所示,本申请实施例公开了一种化学物质合成分析方法,包括:步骤S10:获取待分析化学物质的待分析表达式。需要说明的是,本步骤中的待分析化学物质指的是在实际应用场景下,需要进行化学物质合成分析的化学物质,此处所指的进行化学物质合成分析的目的是对待分析化学物质的合成路线进行分析。本步骤获取的待分析化学物质的待分析表达式表示的是相应待分析化学物质的组成元素以及各组成元素的比例。另外,本步骤中的待分析化学物质可以是根据功能需求设计的理论上能够稳定存在的化学物质,也可以是当前实际存在但尚且无法由人工方式合成的化学物质。步骤S11:将待分析表达式输入至合成分析模型。其中,合成分析模型至少由基于样本表达式划分得到的词向量,以及样本表达式对应的化学属性信息对神经网络模型训练得到。在获取到待分析化学物质的待分析表达式之后,本步骤进一步将待分析表达式输入至合成分析模型,目的是通过合成分析模型将待分析化学物质作为目标分子,并根据待分析本文档来自技高网
...

【技术保护点】
1.一种化学物质合成分析方法,其特征在于,包括:/n获取待分析化学物质的待分析表达式;/n将所述待分析表达式输入至合成分析模型;其中,所述合成分析模型至少由基于样本表达式划分得到的词向量,以及所述样本表达式对应的化学属性信息对神经网络模型训练得到;/n获取所述合成分析模型生成的中间分子,并基于所述中间分子生成所述待分析化学物质的合成路线信息。/n

【技术特征摘要】
1.一种化学物质合成分析方法,其特征在于,包括:
获取待分析化学物质的待分析表达式;
将所述待分析表达式输入至合成分析模型;其中,所述合成分析模型至少由基于样本表达式划分得到的词向量,以及所述样本表达式对应的化学属性信息对神经网络模型训练得到;
获取所述合成分析模型生成的中间分子,并基于所述中间分子生成所述待分析化学物质的合成路线信息。


2.根据权利要求1所述的化学物质合成分析方法,其特征在于,所述合成分析模型的生成过程,包括:
获取样本表达式以及所述样本表达式的化学属性信息;
将所述样本表达式划分为所述词向量;
基于包含有所述词向量以及所述化学属性信息的特征向量对所述神经网络模型进行训练,得到所述合成分析模型。


3.根据权利要求2所述的化学物质合成分析方法,其特征在于,在所述基于包含有所述词向量以及所述化学属性信息的特征向量对所述神经网络模型进行训练之前,所述方法还包括:
获取生成所述样本表达式的化学反应方程式;
提取所述化学反应方程式中的方程式分子信息;
所述基于包含有所述词向量以及所述化学属性信息的特征向量对所述神经网络模型进行训练,包括:
基于包含有所述词向量、所述化学属性信息以及所述方程式分子信息的特征向量对所述神经网络模型进行训练。


4.根据权利要求3所述的化学物质合成分析方法,其特征在于,所述方程式分子信息包括反应物分子信息、反应试剂分子信息以及反应产物分子信息。<...

【专利技术属性】
技术研发人员:李辰徐哲蒋东东金良赵雅倩李仁刚
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1