化学反应的分类和知识层次模型的建立及其可视化方法技术

技术编号:2870615 阅读:274 留言:0更新日期:2012-04-11 18:40
一种化学反应的分类、表示同类反应的通式反应的获取、反应知识层次模型的建立及其可视化方法,其特征是由下述方法:    将化学反应的反应中心已标记的反应物和产物的结构读入计算机,先通过软件产生反应一级描述符,由反应一级描述符向量构成可度量的化学反应超空间,在化学反应超空间中进行化学反应的第一次分类,或者将化学反应超空间转换到一个较低维的空间中进行化学反应的第一次分类,依此选择每一类化学反应后计算机自动推演出每一类化学反应的核心结构用于生成这些反应的二级描述符,由反应二级描述符向量构成第二个可度量的化学反应超空间,在此化学反应超空间中进行化学反应的第二次分类,或者将此化学反应超空间转换到一个较低维的空间中进行化学反应的第二次分类,依此选择每一类化学反应后计算机自动推演出每一类化学反应的通式反应的核心结构和取代基,并组成描述这些反应知识的层次模型,同时或者分别进行反应描述符、反应描述符矢量、化学反应超空间中化学反应、分类后的同一类反应中的每个化学反应、用通式反应表示的同类化学反应的可视化。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及化学反应的分类、表示同类反应的通式反应的获取、反应知识层次模型的建立及其可视化方法,即对化学反应进行分类的方法,对分类后得到的每一类化学反应推演出它们的通式反应的方法和表述反应知识的层次模型的建立方法,涉及为实现这些技术所需的特殊的化学反应处理方法和可视化方法。
技术介绍
已有100多年历史的化学所积累的反应数据量已超了1000多万个,并大多由反应数据库进行管理。这些数据库都配备了基于结构检索的查找反应信息的方法子结构检索,反应检索,相似性检索,精确检索和反应位置检索等。但是,化学家还是感到仍难于充分利用反应数据库来解决合成问题。因为解决合成问题至今仍是一个主要依赖于经验甚至凭直觉的过程,这些传统的基于结构的计算机检索方法与合成化学家解决问题的方法相去甚远。前者往往只会作刻板查找,要么有结果,要么没有;后者往往采用渐进方式。数据库很难配合合成化学家的跳跃式地思考和迂回侧击解决问题的方法,这就使得反应数据库难于得到充分的利用。为了解决这一问题本专利技术提出了一种将化学反应进行分类并转换成通式反应和建立描述反应知识的层次模型及其可视化的技术。对化学反应进行分类的各种不同方法早就有之,如按反应机理或反应发现人的名字来区分与命名不同的反应。但是,这些分类方法往往不适合计算机系统。本专利技术采用了根据反应中心的模式进行分类的方法。所谓反应中心是指在反应过程所有发生键断裂或/和生成的原子。反应中心的模式,简称反应模式是指描述反应中心所构成的一种反应程式,它表述了反应物向产物转化时化学结构的变化。把具有相同反应模式的所有反应称为同类反应,因此一个同类反应往往可包含许多特定反应。为了简明扼要地表述同类反应中的许多反应,化学家常采用一种如下所示的称为通式反应的紧凑反应表示方式 但是,按反应模式对化学反应进行分类不是显而易见的,特别当需要处理的反应数量很大时。本专利技术提供了解决这一问题的方法。
技术实现思路
本专利技术的目的是提供一种化学反应的分类、通式反应的获取、反应知识层次模型的建立及其可视化方法。本专利技术的化学反应的分类方法,是根据化学反应中反应物和生成物化学结构的变化对反应进行两次分类、对分类后得到的每一类化学反应推演出它们的通式反应和以层次模型表述的反应知识及其可视化方法。化学反应的分类方法由(1)反应描述符的产生;(2)化学反应超空间的构成;(3)化学反应的二级分类;(4)通式反应和以层次模型表述的反应知识的获取以及可视化等四个主要步骤组成,流程如图1所示。换言之,本专利技术的方法是一种化学反应的分类、通式反应和以层次模型表述的反应知识的获取及其可视化方法,是将化学反应中反应物和生成物的结构读入计算机,通过软件产生化学反应描述符,由化学反应描述符向量构成可度量的化学反应超空间,直接在化学反应超空间中或者将化学反应超空间转换到一个较低维的空间中对化学反应进行两次分类,选择一类化学反应后计算机自动推演出这一类化学反应的通式反应和以层次模型表述的反应知识,同时或者分别进行化学反应描述符矢量的可视化、化学反应超空间中化学反应可视化、分类后的同类化学反应中所有化学反应的可视化或用通式反应表示的同类化学反应的可视化。本专利技术的方法包括一种根据化学反应中反应物和生成物的结构对它们进行分类的方法、一种基于每一类化学反应中的反应物和生成物的结构推演出它们通式反应的方法、一种以通式反应表述的反应知识层次模型的建立方法、一种为实现上述技术所需的特殊的化学反应处理方法、为实现上述技术的每一步提供可视化方法。本专利技术提供的根据化学反应中反应物和生成物的结构对它们进行分类的方法中的结构是指描述反应物和生成物中原子间拓扑连接关系的二维化学结构式以及它们存储在计算机中的描述了这种原子间拓扑连接关系的文件。将化学反应中反应物和生成物的结构图输入到计算机中可采用专用的化学反应输入软件,如美国MDL公司的ISIS/Draw(可在http//www.mdli.com站点免费下载),并以MDL公司的MOL格式存储。本专利技术提供的对化学反应进行两次分类的方法基本相同,但采用的反应描述符不同。第一次分类时,不同的反应都采用同一组普适性好的称作反应一级描述符的反应描述符进行分类,然后在第一次分类结果的基础上,得到每一类反应的公共结构特征作为第二次分类的结构描述符,再进行更精细的分类得到有相同反应核心的最终精细分类——通式反应。本专利技术提供的第一次分类方法为了能更强调反应中心直接邻近环境对反应的影响,尽可能的降低远程环境对反应的影响,仅取以反应产物的反应中心为基础向外扩展三层的拓扑结构来作为被描述的对象。根据这一原则图2所示Michael加成反应的一产物1被先截去外层的原子和键变成图2中所示的2以后再用于产生反应一级描述符。本专利技术提供的根据化学反应中反应物和生成物的结构对它们进行分类的方法中的反应一级描述符的产生是应用所定义的139个一级描述符逐个在反应中心以及反应中心以外三层结构内进行查找,即可得到每个描述符在其中的出现次数。由这些出现次数组成的向量构成了一个描述化学反应139个特征的139维向量,称化学反应一级描述符向量。这139个描述符即构成了第一次分类的化学反应超空间,或者说每个由这个向量所描述的反应就变成了在这个超空间中的一个点。它们在这超空间中距离的远近反映了它们之间的相似程度,据此可方便地对它们进行分类。计算反应一级描述符参数的方法已被本专利专利技术人程序化了。运行这个由本专利专利技术人自主开发的ReactAnalys软件就可方便地完成化学反应一级描述符的产生。本专利技术提供的方法中使用的全部(139个)反应一级描述符列于表1中。表1 本专利技术中使用的139个一级反应结构描述符 1.A表示除氢以外的任何原子,Q表示除碳和氢以外的任何原子,R除芳香环以外的任何环键,Not表示没有或不是,X表示卤素,RING表示任何环,AROMBOND表示芳香键,M表示任何原子,例如,3M RING表示由三个任何原子组成的环;2.“__”表示链上的键,“_”表示单键,“2”表示双键,“T”表示叁键,“Arom”表示芳香键,“notArom”表示非芳香环键,如果表示两个原子的元素符号间省略了键的标记,则表示可为任何键,例如,“CC”表示两个可以任何键连接的碳原子;3.Group表示元素周期表中的族,Period表示元素周期表中的周期,Heterocycle表示含杂原子的非芳香环,例如,S Heterocycle表示含硫原子的非芳香杂环,AromHeterocycle表示含杂原子的芳香环,AromSulfurHeterocycle表示含硫原子的芳香环,AromOxygenHeterocycle表示含氧原子的芳香环,AromNitrogenHeterocycle表示含氮原子的芳香环;4.GroupVB,VIB,VIIB表示元素周期表中的第5,6或7副族中的元素,GroupIVA,VA,VIA Periods4-6表示既是元素周期表中的第4,5或6主族中又是第4-6周期中的元素,GroupIIIB,IVB表示元素周期表中的第3,4副族中的元素,Actinide表示锕系元素,Lanthanide表示镧系元素。本专利技术提供的第二次分类方法中,反应结构描述符的选择是要解决的首本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:姚建华朱倩李丰袁身刚陈海峰
申请(专利权)人:中国科学院上海有机化学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利