利用碳谱数据确定长链有机化合物结构的方法及系统技术方案

技术编号:9832958 阅读:498 留言:0更新日期:2014-04-01 23:45
本发明专利技术提供一种利用核磁共振碳谱数据确定长链有机化合物结构的方法及系统,包括如下步骤:输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值;提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数;计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度。利用本发明专利技术方法,节省研究时间,提高科研效率,节约科研成本。

【技术实现步骤摘要】
利用碳谱数据确定长链有机化合物结构的方法及系统
本专利技术涉及一种利用部分核磁共振碳谱数据快速确定长链有机化合物结构的方法及系统。
技术介绍
核磁共振碳谱(Carbon-13NuclearMagneticResonance,13C-NMR)技术在上世纪70年代开始应用于化合物结构分析,碳谱数据具有精确度高,分布范围宽,重叠少,易辨认等优点,已成为确定有机化合物结构的指纹特征,迄今已积累了约5万个长链有机化合物的核磁共振碳谱数据。有机化学研究领域中,根据核磁共振碳谱数据对分离得到的未知化合物的结构确定,一直以来都是依靠个人经验和手工查阅文献资料。个人经验需要长时间的积累,且具有较大的主观性和局限性,另外,有机化合物种类繁多,结构复杂,即使毕生从事核磁共振碳谱研究的专家,也只能精通部分化合物的碳谱特征。核磁共振碳谱数据分布于国内外500余种期刊,且跨度长达40余年,查阅起来非常困难。利用上述常规方法,即使确定一个文献中已发表过的长链化合物的结构,也往往需要数天至数周的时间,如果文献资料不充足,还需要对该化合物进行多种波谱测试,如二维核磁共振,紫外,红外等,浪费了大量的时间和经费;对于文献中从未发表过的新长链化合物,通常需要数周至数月的时间,严重了影响了研究的速度。对于长链有机化合物分子,侧链中常具有5个至数十个CH2基团,且彼此相连,由于化学环境相似,这些CH2的核磁共振碳谱数据相差较小,常堆积在一起,不易区分,文献中对于这些CH2的碳谱数据通常都是给出一段范围,而没有对其进行具体归属,这就导致了这类化合物的碳谱数据存在严重的残缺性。文献中,长链有机化合物的碳谱值常由两部分组成,精确碳谱数值(每个碳原子有具体的碳谱数值)和非精确碳谱数值(该部分碳原子没有具体的碳谱数值,仅给出一个范围)。如果采用常规的碳谱数据比较方法,仅能比较精确碳谱数值,即使对同一个长链有机化合物的实验数据和文献数据进行比较,得到的相似度也会非常低,不利于用计算机进行智能检索。
技术实现思路
本专利技术的目的是为了解决上述问题,提供一种利用核磁共振碳谱数据快速确定长链有机化合物结构的方法及系统。为了实现上述目的,本专利技术的技术方案如下:一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,包括如下步骤:(1)输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值和whma加权值;(2)提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;(3)将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;(4)记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数,所述匹配成功的碳谱值个数分为匹配成功的精确碳谱值个数和匹配成功的非精确碳谱值个数;(5)计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度,其中,a是whma加权值,a+b=1,0<a<1,0<b<1;(6)若匹配相似度≥60%,记录该组碳谱数据对应的有机化合物的编号及匹配相似度,显示结果。其中,whma加权值是指以whma命名的加权值。优选地,所述步骤(3)中的循环比对具体实现为:将临时表中各个碳谱数据中的各个碳谱值依次与所输入的碳谱数据进行比对,若进行比对的碳谱值为非精确值,即范围值,将此范围值中的最小值减去容差值,最大值加上容差值,得到比对范围值;若进行比对的碳谱值为精确值,将此精确值分别减去和加上容差值,得到比对范围值;若所输入的碳谱数据落入上述比对范围值,则此碳谱值匹配成功。优选地,所述a的取值范围为0.4-0.8,所述b的取值范围为0.6~0.2。a和b的取值可以依据用户输入化合物碳谱数据的个数及数据库中化合物的长链个数比重调整。优选地,所述步骤(6)中的匹配相似度≥80%时,记录该组碳谱数据对应的有机化合物的编号。优选地,所述容差值的取值范围为0.5-2。本专利技术还提供一种利用核磁共振碳谱数据确定长链有机化合物结构的系统,所述系统包括:输入模块,用于输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值和whma加权值;储存模块,建立数据库的基本单元,存放结构已知的长链有机化合物的碳谱数据、结构和名称;处理模块,将储存模块中符合参数条件的各组碳谱数据提取,并与所输入的碳谱数据进行循环比对,记录匹配成功的碳谱值个数,根据匹配成功的碳谱值个数计算各组碳谱数据与所输入的碳谱数据的匹配相似度;输出模块,将匹配相似度≥60%的化合物信息输出给用户;维护模块,用于后台管理、数据的导入及维户。优选地,所述化合物信息包括化合物的名称,分子式,结构图及文献信息。优选地,所述匹配相似度的计算公式为其中,a+b=1,0<a<1,0<b<1。有益效果与现有技术相比,本专利技术根据长链有机化合物的碳谱数据特性得到碳谱数据之间的匹配相似度的计算方法,而开发出一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,该方法与系统相结合,得到了一种简便、可靠、快速的确定长链有机化合物结构的系统。该方法的优点在于,能够将结构待定的化合物的碳谱数据快速与数据库中收录的数量巨大的结构已知的化合物的碳谱数据进行比对,根据匹配相似度计算公式,快速、准确的找到与结构待定的化合物的碳谱数据的匹配相似度≥60%的碳谱数据,并根据具体的匹配相似度的百分比帮助确定化合物结构。节省研究时间,提高科研效率。利用本专利技术,使确定一个长链化合物骨架的时间由数小时至数周时间,缩短为几秒钟。节省研究经费。利用本专利技术,只利用碳谱和分子量就能确定一个长链化合物的结构,节省了测试红外,紫外,二维核磁共振谱等费用,仅1个合物就能为研究人员节省1000元。附图说明图1为本专利技术方法的流程图;图2为本专利技术系统的结构示意图。具体实施方式为了更好说明本专利技术的目的、技术方案和优点,下面结合附图和具体实施例对本专利技术作进一步描述。实施例1一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,包括如下步骤:1、用户输入14,14.1,22.67,31.91,33.42,34.77,51.56,70.11,72.4,77.4,84.93,174.94,设定溶剂选项为CDCl3,容差值为1。2、系统从数据库中检索出溶剂为CDCl3的两组碳谱数据:化合物编号为5,碳谱值为14.1,14.1,33.42,34.77,51.56,70.11,72.4,77.4,84.93,174.94,22.67-31.91。其中22.67-31.91为非精确碳谱值。化合物编号为250,碳谱值为14,56.8,102.3,119.4,129.9,130,151.7,161.2,181.8,183,22.4-32。将上述两组数据读入临时表中。3、将临时表中的两组碳谱数据与用户输入的碳谱数据进行循环比对,从编号为5的化合物开始比较:(1)化合物编号为5的第一个碳谱值为14.1,分别加上和减去容差值1得到比对范围为13.1-15.1,用户输入的碳谱数据为14,14.1,22.67,31.91,33.42,34.77,51.56,70.11,72.4本文档来自技高网
...
利用碳谱数据确定长链有机化合物结构的方法及系统

【技术保护点】
一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,其特征在于,包括如下步骤: (1)输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值和whma加权值;(2)提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;(3)将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时列表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;(4)记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数,所述匹配成功的碳谱值个数分为匹配成功的精确碳谱值个数和匹配成功的非精确碳谱值个数;(5)计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度,其中,a是whma加权值,a+b=1,0

【技术特征摘要】
1.一种利用核磁共振碳谱数据确定长链有机化合物结构的方法,其特征在于,包括如下步骤:(1)输入结构待定的长链有机化合物的碳谱数据,设定所输入的碳谱数据的参数条件,所述参数条件包括氘代试剂、容差值和whma加权值;(2)提取数据库中与上述参数条件中的氘代试剂匹配的结构已知的有机化合物的碳谱数据并读入临时表;(3)将临时表中的各组碳谱数据与所输入的碳谱数据进行循环比对,所述临时表中的各组碳谱数据包括精确碳谱数据和非精确碳谱数据;(4)记录临时表中各组碳谱数据与所输入的碳谱数据匹配成功的碳谱值个数,所述匹配成功的碳谱值个数分为匹配成功的精确碳谱值个数和匹配成功的非精确碳谱值个数;(5)计算临时表中各组碳谱数据与所输入的碳谱数据的匹配相似度,其中,a是whma加权值,a+b=1,0<a<1,0<b<1;(6)若匹配相似度≥60%,记录该组碳谱数据对应的有机化合物的编号及匹配相似度,显示结果。2.根据权利要求1所述的方法,其特征在于,所述步骤(3)中的循环比对具体实现为:将临时表中各个碳谱数据中的各个碳谱值依次与所输入的碳谱数据进行比对,若进行比对的碳谱值为非精确值,即范围值,将此范围值中的最小值减去容差值,最大值加上容差值,得到比对范围值;若进行比对的碳谱值为精确值,将此精确值分别减去和加上容差值,得到比对范围值;若所输入...

【专利技术属性】
技术研发人员:马文辉蔡芳正
申请(专利权)人:上海微谱信息技术有限公司
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1