一种基于已知反应智能预测未知化学反应的方法技术

技术编号:36800124 阅读:22 留言:0更新日期:2023-03-08 23:35
本发明专利技术公开了一种基于已知反应智能预测未知化学反应的方法,包括:a)建立已知反应数据库;b)预测未知化学反应。本发明专利技术所述方法可预测多个已知化合物之间能否发生反应,且能预测能反应时的可能产物的结构,整个预测过程对人的依赖度低,智能化程度高,可实现低人工成本、高效和高准确性的基于已知反应智能预测未知化学反应,并且,本发明专利技术所述反应数据库的建立具有通用性,可适用于未来新发现的化学反应,易于后期维护更新;因此,本发明专利技术相对于现有技术,具有显著性进步和更高应用价值。具有显著性进步和更高应用价值。

【技术实现步骤摘要】
一种基于已知反应智能预测未知化学反应的方法


[0001]本专利技术是涉及一种基于已知反应智能预测未知化学反应的方法,属于大数据处理


技术介绍

[0002]在制药等化学化工领域,药物或产品的研发过程中需要合成各种有机分子。传统研发过程,是由研发人员通过查询化学反应数据库,并结合自身的化学合成知识和合成经验进行未知反应预测,再通过实验来验证预测结果。这种反应预测结果的正确性极度依赖于研发人员对于合成知识的全面性掌握,以及对合成知识的灵活运用能力,从而大大提高了反应预测的门槛,影响了研发效率。因此,若能利用大数据和化学信息学技术提供一种能够智能预测化学反应的方法,将具有非常重要的应用价值。
[0003]目前,市面上主流的有机合成路线预测软件,其基本原理都是根据大量化学反应数据提取反应中发生变化的部分(称为反应中心),然后将要合成的分子与反应中心进行匹配,一步步逆推直到可购买的化学品原料,从而获得合成目标分子的完整合成路线。由此可知,目前现有技术中的计算机辅助合成技术都是基于逆向合成,推测出反应路线,而逆向合成或者说逆向推导是基于主要产物数量较少,而正向推导所有可能发生的反应,运算难度及运算量都会显著增加。
[0004]申请号为CN202011302735.1的中国专利申请中公开了一种化学反应产物的预测方法,包括:a)建立包含化学反应文献的数据库,根据文献记载的化学反应计算出起始分子之间进行单步所有可能发生的反应,并对反应产物进行化学结构合理性判断和化学结构准确性判断,得到筛选后的产物;b)将步骤a)得到的筛选后的产物与起始的所有化合物进行多轮运算,得到每个单步化学反应发生过程中体系内所有可能产生的反应产物,最后对每个分子量下的产物结构进行筛选,找出最有可能的结构。虽然该预测方法能够实现通过反应原料进行反应产物的正向预测,但由于目标反应物中可能存在多个同类型的潜在反应中心,在预测场景中具体哪个中心起作用,有很多影响因素,比如:中心周围立体空间的不同会导致中心参与反应的难易程度差异;中心周围环境的吸电子效应、供电子效应或共振效应等,会增强或削弱潜在反应中心的活性;因此,该种预测方法还需将筛选后的产物与起始的所有化合物进行多轮运算,还需要对每个分子量下的产物结构进行质谱分析进行一一筛选,才能最终找出最有可能的结构,很明显,该预测方法极为复杂,其预测的准确性仍极度依赖于对化学反应知识掌握的深度与广度,并且后期维护更新的难度也会越来越大,还不能很好地实现低人工成本、高效和高准确性智能预测未知化学反应。

技术实现思路

[0005]针对现有技术存在的上述问题,本专利技术的目的是提供一种能实现低人工成本、高效和高准确性的基于已知反应智能预测未知化学反应的方法。
[0006]为实现上述专利技术目的,本专利技术采用如下技术方案:
[0007]一种基于已知反应智能预测未知化学反应的方法,包括如下步骤:
[0008]a)建立已知反应数据库
[0009]收集已知的化学反应信息,并采用代码表示每个已知反应中的各反应物的反应特性和每个已知反应的反应规则;
[0010]b)预测未知化学反应
[0011]b1)用各目标反应物顺次检索步骤a)所建立的已知反应数据库,获取每个目标反应物各自所对应的反应规则的集合;
[0012]b2)判断待预测的所有目标反应物所对应的反应规则的集合之间是否存在交集;
[0013]b3)若判断交集为空,说明根据当前的已知反应数据库的判断,待预测的目标反应物之间不能发生反应,则退出智能预测;若判断交集不为空,则进行步骤b4);
[0014]b4)顺次采用交集中的各反应规则,结合各目标反应物,分别检索步骤a)所建立的已知反应数据库,以获取各目标反应物以相同反应规则F
i
参与的反应实例及每个目标反应物在其参与的反应实例中的反应特性;其中的i为大于等于1的自然数;
[0015]b5)若待预测的所有目标反应物在其参与的反应实例中的反应特性的线性组合不等于反应规则F
i
,则判断待预测的目标反应物之间不能发生具有反应规则F
i
的反应;若待预测的所有目标反应物在其参与的反应实例中的反应特性的线性组合等于反应规则F
i
,则判断待预测的目标反应物之间能发生具有反应规则F
i
的反应;
[0016]b6)根据待预测的各目标反应物在各自反应实例中所对应的产物结构片段,预测目标反应产物的结构。
[0017]一种实施方案,步骤a)中,每个反应物的反应特性是该反应物各位点反应特性的线性组合,且各位点反应特性之间以字符串由小到大排序,并以字符

`

予以分隔。
[0018]进一步实施方案,各位点反应特性的代码格式为:反应位点的元素符号`T:反应位点的类型`反应位点的环境信息`反应位点的生成键信息。
[0019]进一步实施方案,若反应位点的元素为氟、氯、溴、碘或砹,均采用字符

X

作为该反应位点的元素符号,其余均采用反应位点本身元素符号作为对应反应位点的元素符号。
[0020]进一步实施方案,根据反应位点临接原子和临接键在反应后是否发生变化,将反应位点分为四种类型,分别以数字1、2、3、4表示,具体如下:
[0021]1:表示反应后,反应位点的原有临接原子未脱除,但增加了新的临接原子,且原有临接键的键型有变化;
[0022]2:表示反应后,反应位点的原有临接原子未脱除,但增加了新的临接原子,且原有临接键的键型未变化;
[0023]3:表示反应后,反应位点的原有临接原子有脱除,并增加了新的临接原子,且其余临接键的键型有变化;
[0024]4:表示反应后,反应位点的原有临接原子有脱除,并增加了新的临接原子,且其余临接键的键型未变化。
[0025]进一步实施方案,用数字表示各种键型,具体为:1表示单键,2表示双键,3表示叁键,1.5表示芳香键。
[0026]进一步实施方案,若反应位点的原有临接原子在反应后未脱除,则以该反应位点在反应前的临接键中包含的双键、叁键和芳香键的信息作为该反应位点的环境信息,代码
格式为:“E:待输出的临接键类型”;若包含多个键型,则以键型数字由小到大顺序输出;若不包含双键、叁键和芳香键,则以空字符串
“”
表达该反应位点的环境信息。
[0027]进一步实施方案,若反应位点的原有临接原子在反应后有脱除,则以该反应位点的脱除原子信息作为该反应位点的环境信息,代码格式为:“D:脱除原子的元素符号_反应位点与脱除原子间的键型”。
[0028]进一步实施方案,以反应位点在反应后与新增临接原子间的键型信息,作为该反应位点的生成键信息,代码格式为:“Nbd:反应位点与新增临接原子间的键型”,若有多个键型,则以键型数字由小到大顺序输出。
[0029]一种实施方案,步骤a)中,每个已知反应的反本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于已知反应智能预测未知化学反应的方法,其特征在于,包括如下步骤:a)建立已知反应数据库收集已知的化学反应信息,并采用代码表示每个已知反应中的各反应物的反应特性和每个已知反应的反应规则;b)预测未知化学反应b1)用各目标反应物顺次检索步骤a)所建立的已知反应数据库,获取每个目标反应物各自所对应的反应规则的集合;b2)判断待预测的所有目标反应物所对应的反应规则的集合之间是否存在交集;b3)若判断交集为空,说明根据当前的已知反应数据库的判断,待预测的目标反应物之间不能发生反应,则退出智能预测;若判断交集不为空,则进行步骤b4);b4)顺次采用交集中的各反应规则,结合各目标反应物,分别检索步骤a)所建立的已知反应数据库,以获取各目标反应物以相同反应规则F
i
参与的反应实例及每个目标反应物在其参与的反应实例中的反应特性;其中的i为大于等于1的自然数;b5)若待预测的所有目标反应物在其参与的反应实例中的反应特性的线性组合不等于反应规则F
i
,则判断待预测的目标反应物之间不能发生具有反应规则F
i
的反应;若待预测的所有目标反应物在其参与的反应实例中的反应特性的线性组合等于反应规则F
i
,则判断待预测的目标反应物之间能发生具有反应规则F
i
的反应;b6)根据待预测的各目标反应物在各自反应实例中所对应的产物结构片段,预测目标反应产物的结构。2.根据权利要求1所述的基于已知反应智能预测未知化学反应的方法,其特征在于:步骤a)中,每个反应物的反应特性是该反应物各位点反应特性的线性组合,且各位点反应特性之间以字符串由小到大排序,并以字符

`

予以分隔。3.根据权利要求2所述的基于已知反应智能预测未知化学反应的方法,其特征在于,各位点反应特性的代码格式为:反应位点的元素符号`T:反应位点的类型`反应位点的环境信息`反应位点的生成键信息。4.根据权利要求3所述的基于已知反应智能预测未知化学反应的方法,其特征在于:若反应位点的元素为氟、氯、溴、碘或砹,均采用字符

X

作为该反应位点的元素符号,其余均...

【专利技术属性】
技术研发人员:李英勇赵英莉周俊红戴静芳徐挺军
申请(专利权)人:中国科学院上海有机化学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1