基于特征基团的化学结构预测方法、系统、存储介质及终端技术方案

技术编号:37958269 阅读:13 留言:0更新日期:2023-06-30 09:32
本发明专利技术公开了基于特征基团的化学结构预测方法、系统、存储介质及终端,包括:构建常用特征基团对应的多种谱图区间数及谱图阈值对至数据库中;将用户输入的谱图数据与数据库中的多种谱图区间数进行一级遍历匹配和多级遍历匹配,合并所有一级确切匹配集和多级确切匹配集中的特征基团,得到确切特征基团。本发明专利技术通过多级边界匹配可以有效且精准地减少进一步查询的数据量,进而提高化学结构确定过程的效率,操作简单,不需要依赖有经验的操作人员手动操作,更加高效准确。更加高效准确。更加高效准确。

【技术实现步骤摘要】
基于特征基团的化学结构预测方法、系统、存储介质及终端
[0001]母案:申请号:2022116000881;名称:基于图谱的化学结构确定方法、系统、存储介质及终端


[0002]本专利技术涉及多种图谱鉴定化合物
,尤其涉及基于特征基团的化学结构预测方法、系统、存储介质及终端。

技术介绍

[0003]核磁共振技术可以提供分子的化学结构和分子动力学的信息,已成为分子结构解析以及物质理化性质表征的常规技术手段,在物理、化学、生物、医药、食品等领域得到广泛应用,在化学中更是常规分析不可少的手段。经验所得,我们已经对各类型官能团在核磁共振图谱中的化学位移都有了较高程度的总结。
[0004]一直以来,利用核磁共振数据分析化合物结构都是人工完成,需要依靠个人经验和文献查阅对比数据来确定。然而这一方法效率极低,需花费大量时间在查阅文献上。
[0005]目前,对此改进的方法就是使用计算机比对内部数据库的核磁共振碳谱数据,以达到确定有机化合物结构,然而由于查询数据的离散性,这种一一对比进行匹配的方式工作量较大、效率较低、成功率较低、准确性不高,同时需要有经验的操作人员手动操作,实用性不高。

技术实现思路

[0006]本专利技术的目的在于克服现有技术中化合物结构确定存在的问题,提供了基于图谱的化学结构确定方法、系统、存储介质及终端,将用户的某种图谱数据匹配为不同的集合区间,针对不同的集合区间,采取不同的处理措施,以准确匹配出用户查询数据中的特征基团信息,最后对确切匹配的特征基团进行多种模式合成反馈。
[0007]本专利技术的目的是通过以下技术方案来实现的:
[0008]在第一方案中,提供一种基于特征基团的化学结构预测方法,所述方法包括:
[0009]构建常用特征基团对应的多种谱图区间数及谱图阈值对至数据库中;
[0010]将用户输入的谱图数据与数据库中的多种谱图区间数进行一级遍历匹配,得到一级候选匹配集;
[0011]将所述一级候选匹配集划分为一级确切匹配集、一级边界匹配集以及一级无关匹配集,其中,若谱图数据中某个数值匹配到唯一一个谱图区间数,则将相应的特征基团存放至一级确切匹配集中;若谱图数据中某个数值匹配到多个谱图区间数,则将相应的特征基团存放至一级边界匹配集中;若谱图数据中某个数值无法匹配到谱图区间数,则将该数值存放至一级无关匹配集中;
[0012]迭代添加另外的谱图数据,对所述一级边界匹配集中的特征基团进行多级遍历匹配直至多级遍历匹配为空,得到多级候选匹配集,同理将所述多级候选匹配集划分为多级
确切匹配集、多级边界匹配集以及多级无关匹配集;
[0013]合并所有一级确切匹配集和多级确切匹配集中的特征基团,得到确切特征基团;
[0014]根据所述确切特征基团确定化学结构。
[0015]在一个示例中,一种基于特征基团的化学结构预测方法,所述一级遍历匹配包括:
[0016]将谱图数据中每个数值与谱图区间数一一匹配,每个数值在匹配时,加上谱图阈值对,形成区间得到区间的匹配。
[0017]在一个示例中,一种基于特征基团的化学结构预测方法,将一级无关匹配集和多级无关匹配集中对应的数值删除。
[0018]在一个示例中,一种基于特征基团的化学结构预测方法,所述根据所述确切特征基团确定化学结构,包括:
[0019]使用多种模式联合确定化学结构,其中,所述多种模式包括相似度计算以及人工智能预测。
[0020]在一个示例中,一种基于特征基团的化学结构预测方法,所述相似度计算,包括:
[0021]将所述确切特征基团与数据库中的化合物进行相似度计算,并根据相似度由大到小反馈。
[0022]在一个示例中,一种基于特征基团的化学结构预测方法,所述人工智能预测,包括:
[0023]利用神经网络模型对确切特征基团的简化分子线性输入规范进行端到端的合成预测。
[0024]在一个示例中,一种基于特征基团的化学结构预测方法,所述多种谱图包括碳谱、氢谱、红外谱以及氟谱。
[0025]在第二方案中,提供一种基于特征基团的化学结构预测系统,所述系统包括:
[0026]特征基团数据库,用于构建常用特征基团对应的多种谱图区间数及谱图阈值对;
[0027]一级遍历匹配模块,用于将用户输入的谱图数据与数据库中的多种谱图区间数进行一级遍历匹配,得到一级候选匹配集;
[0028]将所述一级候选匹配集划分为一级确切匹配集、一级边界匹配集以及一级无关匹配集,其中,若谱图数据中某个数值匹配到唯一一个谱图区间数,则将相应的特征基团存放至一级确切匹配集中;若谱图数据中某个数值匹配到多个谱图区间数,则将相应的特征基团存放至一级边界匹配集中;若谱图数据中某个数值无法匹配到谱图区间数,则将该数值存放至一级无关匹配集中;
[0029]多级遍历匹配模块,用于迭代添加另外的谱图数据,对所述一级边界匹配集中的特征基团进行多级遍历匹配直至多级遍历匹配为空,得到多级候选匹配集,同理将所述多级候选匹配集划分为多级确切匹配集、多级边界匹配集以及多级无关匹配集;
[0030]特征基团合并模块,用于合并所有一级确切匹配集和多级确切匹配集中的特征基团,得到确切特征基团;
[0031]化学结构预测模块,用于根据所述确切特征基团确定化学结构。
[0032]在第三方案中,提供一种存储介质,其上存储有计算机指令,所述计算机指令运行时执行任意一项所述化学结构预测方法的步骤。
[0033]在第四方案中,提供一种终端,包括存储器和处理器,存储器上存储有可在处理器
上运行的计算机指令,处理器运行计算机指令时执行任意一项所述化学结构预测方法的步骤。
[0034]需要进一步说明的是,上述各选项对应的技术特征在不冲突的情况下可以相互组合或替换构成新的技术方案。
[0035]与现有技术相比,本专利技术有益效果是:
[0036](1)本专利技术通过多级遍历匹配可以有效且精准地减少进一步查询的数据量,进而提高化学结构确定过程的效率,通过在局部视角下迭代的方式,对候选匹配集精准划分,并针对不同的匹配集,采取不同的处理措施,以准确匹配出用户查询数据中的特征基团信息,最终高效匹配出特征基团,本专利技术操作简单,不需要依赖有经验的操作人员手动操作,相较于人工确定化学结构,本专利技术更加高效准确。
[0037](2)在一个示例中,将一级无关匹配集和多级无关匹配集中对应的数值删除,可以有效避免噪声数据的干扰,提高鉴别准确率。
[0038](3)在一个示例中,将谱图数据中每个数值与谱图区间数一一匹配,每个数值在匹配时,加上谱图阈值对,形成区间得到区间的匹配,保证用户输入数据有一定的容错性。
[0039](4)在一个示例中,使用多种模式联合确定化学结构,进一步保证化合物结构的准确性。
附图说明
[0040]图1为本专利技术实施例示出的一种基于特征基团的化学结构预测方法的流程图;
[0041本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于特征基团的化学结构预测方法,其特征在于,所述方法包括:构建常用特征基团对应的多种谱图区间数及谱图阈值对至数据库中;将用户输入的谱图数据与数据库中的多种谱图区间数进行一级遍历匹配,得到一级候选匹配集;所述将用户输入的谱图数据与数据库中的多种谱图区间数进行一级遍历匹配,包括:根据谱图数据确定谱图阈值对,根据该谱图数据和谱图阈值对,依次遍历数据库中对应的特征基团谱图区间数;将所述一级候选匹配集划分为一级确切匹配集、一级边界匹配集以及一级无关匹配集,其中,若谱图数据中某个数值匹配到唯一一个谱图区间数,则将相应的特征基团存放至一级确切匹配集中;若谱图数据中某个数值匹配到多个谱图区间数,则将相应的特征基团存放至一级边界匹配集中;若谱图数据中某个数值无法匹配到谱图区间数,则将该数值存放至一级无关匹配集中;迭代添加另外的谱图数据,对所述一级边界匹配集中的特征基团进行多级遍历匹配直至多级遍历匹配为空,得到多级候选匹配集,同理将所述多级候选匹配集划分为多级确切匹配集、多级边界匹配集以及多级无关匹配集;对所述一级边界匹配集中的特征基团进行多级遍历匹配直至多级遍历匹配为空,包括:输入另外一种区别于上一步边界匹配应用的谱图数据,和上一步边界匹配中的所有特征基团进行匹配,再次根据阈值对划分匹配结果;若当前的边界匹配不为空,则继续添加其他谱图数据进行匹配;合并所有一级确切匹配集和多级确切匹配集中的特征基团,得到确切特征基团;根据所述确切特征基团确定化学结构。2.根据权利要求1所述的一种基于特征基团的化学结构预测方法,其特征在于,所述一级遍历匹配包括:将谱图数据中每个数值与谱图区间数一一匹配,每个数值在匹配时,加上谱图阈值对,形成区间得到区间的匹配。3.根据权利要求1所述的一种基于特征基团的化学结构预测方法,其特征在于,将一级无关匹配集和多级无关匹配集中对应的数值删除。4.根据权利要求1所述的一种基于特征基团的化学结构预测方法,其特征在于,所述根据所述确切特征基团确定化学结构,包括:使用多种模式联合确定化学结构,其中,所述多种模式包括相似度计算以及人工智能预测。5.根据权利要求4所述的一种基于特征基团的化学结构预测方法,其特征在于,所述相似度计算,...

【专利技术属性】
技术研发人员:曹雪梅王薇杨柳青王中健
申请(专利权)人:药融云数字科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1