用于标识复杂分子子结构的割点法制造技术

技术编号:27756249 阅读:27 留言:0更新日期:2021-03-19 13:53
通过使用限定所选分子的最小可分解的单位(MCU)和MCU图,以及所选分子的MCU图中的“割点”,本发明专利技术的实施方式避免了与使用标识和表征大的复杂分子的所有子结构(例如,代谢产物)的常规计算机系统相关的处理问题。系统将所选分子的MCU图在指定割点分开,以产生所选分子的两个分开的MCU图组成部分(即,第一MCU子图和第二MCU子图),并且为两个MCU子图组成部分,分别生成并且利用图遍历算法遍历第一线图组成部分和第二线图组成部分,以在存储器中生成和存储第一组成部分的子结构和分子量的第一数据库,和第二线图组成部分的子结构和分子量的第二数据库。随后,本发明专利技术的实施方式可对两个数据库(或单个数据库的两个子部分)进行二分搜索,以标识和产生具有匹配查询分子量(或查询分子量的范围)的分子量的所选分子的所有子结构的图形表示,包括跨越(即,包括)割点的所选分子的子结构的图形表示。

【技术实现步骤摘要】
【国外来华专利技术】用于标识复杂分子子结构的割点法
本专利技术涉及使用割点法标识复杂分子,特别是大分子比如生物分子的子结构的系统、设备和方法。
技术介绍
标识和表征药学化合物的子结构,比如代谢产物,是药物发现的重要部分。理解这种代谢产物的结构并且限定代谢转化的具体的位点对于,例如,指导药物候选物的先导化合物的合成优化是有用的,以克服通常与那些化合物相关的稳定性和毒性问题。在之前不了解它们的结构的情况下,目前的代谢产物标识(MetID)法已经不能系统地表征来自生物基质的大分子,比如治疗性蛋白质和肽(TPP)的代谢产物了。尽管一些现成的小分子MetID软件,比如MASSCAP、SEQUEST和MassMetaSite,用于表征小分子药物和小直链肽的代谢产物,但是已经证实该软件对于标识较大的生物分子(比如大的非直链肽/蛋白质)的代谢产物和其他子结构不切实际或不合适。对于该缺陷,至少有三种原因:(i)最小分子MetID软件对于大分子不能适当地去卷积单同位素峰,其导致错误的输入质量值;(ii)最小分子MetID软件使用为小分子药物设计的基于原子的算法,并且典型的大生物分子,比如TPP,其原子的数量通常比小分子高1-2个数量级,其为这种基于原子的算法引入巨大的计算复杂性;和(iii)用于小分子MetID(比如细胞色素P450代谢途径或质量缺陷过滤器)的信息,不适用于大分子,因为大分子具有常规的小分子软件一般不考虑的不同代谢过程。与分子的基于原子的呈现相关的计算复杂性可干扰或有时阻碍计算机分析。取决于给定的计算机中RAM的量,标识具有大于10百万种代谢产物的分子的所有代谢产物要求的处理将可能击垮计算机的处理能力。根据专利技术人的经验,一千兆的RAM可应对约一百万个子结构。但是复杂的大分子通常含有超过一千万个子结构,并且的确可通常含有数以亿计的子结构。另外,用于分析蛋白质结构的常规软件,比如基于蛋白质组的软件,例如,通常计算酰胺和二硫键分解,并且迄今为止还不能解决大分子,比如TPP(其包括不可预期的修饰(+Oxy、+P、+Met等)、非天然氨基酸、体内二硫化物扰乱、非天然接头和非特异性蛋白水解的分解)的不可预知的代谢概况。因此,相当需要能够解码大分子,特别是具有非常大量的子结构,例如数以亿计的子结构的那些大分子的非线性肽的系统和过程,以及不仅仅利于区分大分子,比如治疗性肽或蛋白质的代谢产物与生物基质中的蛋白质背景,但是也利于阐明感兴趣的代谢产物的结构的系统和方法。也相当需要提高常规的计算机系统的功能的系统和过程,以便允许那些常规的计算机系统在用于科学家和研究人员观察和分析的监视器和其他显示装置上进行更好的生成和显示大分子代谢产物的结构的视觉呈现的工作。
技术实现思路
一般而言,本专利技术的实施方式可被科学家,比如化学家和生物化学家,用于标识复杂分子的代谢产物和其他子结构,并且确定这种代谢产物和其他子结构的相关化学结构。正因如此,可考虑本专利技术的实施方式对于药物开发和设计非常有用。为了该目的,本专利技术的实施方式采用用于表示正在研究的分子(所选分子)的独特系统。具体地,从限定最小可分解的单位的图,称为最小可分解的单位图(MCU图),的角度,描述所选分子。如本文阐述的,最小可分解的单位为其中不允许进行切割/分解(没有代谢过程)的分子的一部分。最小可分解的单位可包括所选分子的邻接代谢分解位点之间的一组原子。例如,蛋白质或肽分子的最小可分解的单位可包括单个氨基酸,或一片氨基酸,例如。环肽的最小可分解的单位可包括例如环肽的核区域。最小可分解的单位法利于以更简单的方式限定感兴趣的分子,例如,通过尝试将其降低至直链肽领域而降低复杂的蛋白质结构的复杂性。最小可分解的单位法允许用户限定模块,所述模块消除追踪已经在MCU中分解并且因此不具有功能性的代谢产物。所选分子中的每个MCU对应于MCU图中的顶点。MCU图接着由存储在计算机系统的存储器中的数据结构的数据表示。取决于给定研究的目标和如何限定MCU,所选分子可具有许多不同的MCU图。例如,如果研究的目标是标识由酰胺键分解生成的所有代谢产物,则MCU定义为每个单个氨基酸残基,因为用户将考虑在单个氨基酸之外没有进一步的代谢。作为另一示例,如果研究的目标是标识环肽的活性代谢产物,则肽的环区域也将被包括作为MCU,因为活性代谢产物必须具有完整的环区域,并且在环区域中不需要考虑进一步的代谢。本专利技术的专利技术人已经认识到源自MCU图的线图是标识分子的子结构的有效方式,子结构比如代谢产物,并且在本专利技术的子结构标识系统、设备和方法中特别有用。对于此的原因是对于由相应的MCU图表示的分子,MCU图的线图的归纳连接的子图的领域完全并且唯一地表示子结构和代谢产物的整个领域。换句话说,对于由相应的MCU图表示的分子,在MCU图的线图的归纳连接的子图的集合和代谢产物的集合之间存在一对一的关系。该关系为可执行的,因为其允许使用算法标识所选分子的代谢产物的整个领域。对于所选分子,算法的实际应用明显提高了用于标识代谢产物的整个领域的计算机系统的功能。2019年______________提交的共同待决的共有非临时专利申请号____________描述了用于标识复杂分子的子结构的系统和方法,其中系统和方法涉及生成数据库,数据库包括分别对应于所选分子的成千上万或数百万的子结构的成千上万或数百万的记录。然而,存在一些具有数以亿计的或甚至数以十亿计的子结构的大分子,其不能在具有常规的中央处理单元和常规的存储器装置的常规的个人计算机系统上被处理和标识,而不使计算机系统超负荷并且不潜在地使得计算机系统故障或完全停止运行。如下面将更详细地描述,本专利技术的实施方式通过接收和存储表示所选分子的最小可分解的单位(MCU)图的数据,以及所选分子的MCU图中指定的“割点”,避免了该问题。系统接着将所选分子的MCU图在指定的割点处分开,以产生所选分子的两个分开的MCU图组成部分(即,第一MCU子图和第二MCU子图)。系统接着分别为两个MCU子图组成部分生成第一线图组成部分和第二线图组成部分,用图遍历算法遍历第一线图组成部分以为第一组成部分生成子结构和分子量的第一数据库并且将其存储在存储器中,并且然后用图遍历算法遍历第二线图组成部分以为第二线图组成部分构建子结构和分子量的第二数据库并且将其存储在存储器中。可选地,在不背离本专利技术的操作的主原理的情况下,系统可配置为将第一线图组成部分和第二线图组成部分二者的子结构和分子量放置在单个数据库或多个数据库中。随后,利用存储在计算机系统的存储器中的一个或多个数据库(或单个数据库的两个子部分,如果优选的话)中的第一线图组成部分和第二线图组成部分的子结构和分子量,本专利技术的实施方式能够从用户接收查询分子量(或查询分子量的范围),并且在两个数据库(或单个数据库的两个子部分)上进行二分搜索,以标识、检索和显示具有匹配查询分子量(或查询分子量的范围)的分子量的所选分子的所有子结构的图形表示,包括跨越(即,包括)割点的所选分子的子结构。因此,本文所述的割点法可用于动态标识、产生和显示具有匹配指定的给定分子量的分子量的所有本文档来自技高网
...

【技术保护点】
1.一种标识所选分子的子结构的系统,所述系统包括:/na)微处理器;/nb)存储器;/nc)所述存储器中的应用程序,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:/ni)在所述存储器中接收和存储所选分子数据,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中所述最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)所述所选分子的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及所述最小可分解的单位和所述键之间的连接,和(E)所述所选分子中的割点,其中,所述割点的去除将分子分成第一组成部分和第二组成部分,/nii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中的最小可分解的单位的第一键,/niii)基于所述第一MCU图数据,在所述存储器中生成和存储所述所选分子的所述第一组成部分的第一线图数据结构,所述第一线图数据结构填充有表示所述第一MCU图的第一线图的第一线图数据,所述第一线图具有多个第一LG顶点和多个第一LG边缘,每个第一LG顶点对应于所述第一MCU图中的第一MCU图边缘并且每个第一LG边缘对应于所述第一MCU图中通过所述第一MCU图边缘连接在一起的一对第一MCU图顶点,/niv)针对所述所选分子的所述第一组成部分的所述第一线图数据结构中的所述第一线图数据执行图遍历算法,以确定所述第一线图的多个第一归纳连接的子图,每个第一归纳连接的子图包括所述第一线图中的第一LG顶点和第一LG边缘的第一连接子集,以及第一LG顶点和第一LG边缘的所述第一连接子集的第一物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第一连接子集,以及所述所选分子中最小可分解的单位和键的所述第一连接子集的相对位置,/nv)为所述所选分子的所述第一组成部分的第一线图数据结构中表示的每个第一归纳连接的子图,在数据库中创建和存储包括第一分子量字段、第一顶点数据字段和第一边缘数据字段的第一ICS记录,其中所述第一顶点数据字段填充有第一顶点值,所述第一顶点值被配置为指示所述第一归纳连接的子图中每一个第一LG顶点的第一顶点位置,并且所述第一边缘数据字段填充有第一边缘值,所述第一边缘值被配置为指示所述第一归纳连接的子图中的每一个第一LG边缘相对于所述第一LG顶点的第一边缘位置,/nvi)为所述所选分子的所述第一组成部分的所述第一线图数据结构中的每个第一ICS记录,基于所述所选分子的所述所选分子数据和所述第一ICS记录中的所述第一顶点值和所述第一边缘值,在所述第一分子量字段中计算和存储该第一ICS记录的所述第一归纳连接的子图的第一总分子量,/nvii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的所述第二组成部分的第二最小可分解的单位图数据结构,所述第二最小可分解的单位图数据结构填充有表示所述第二组成部分的第二MCU图的第二MCU图数据,所述第二MCU图具有多个第二MCU图顶点和多个第二MCU图边缘,每个第二MCU图顶点对应于所述第二组成部分的最小可分解的单位并且每个第二MCU图边缘对应于连接所述第二组成部分中的最小可分解的单位的第二键,/nviii)基于所述第二MCU图数据,在所述存储器中生成和存储所述所选分子的所述第二组成部分的第二线图数据结构,所述第二线图数据结构填充有表示所述第二MCU图的第二线图的第二线图数据,所述第二线图具有多个第二LG顶点和多个第二LG边缘,每个第二LG顶点对应于所述第二MCU图中的所述第二MCU图边缘并且每个第二LG边缘对应于所述第二MCU图中通过所述第二MCU图边缘连接在一起的一对第二MCU图顶点,/nix)针对所述所选分子的所述第二组成部分的所述第二线图数据结构中的所述第二线图数据执行图遍历算法,以确定所述第二线图的多个第二归纳连接的子图,每个第二归纳连接的子图包括所述第二线图中的第二LG顶点和第二LG边缘的第二连接子集,以及第二LG顶点和第二LG边缘的所述第二连接子集的第二物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第二连接子集,和所述所选分子中最小可分解的单位和键的所述第二连接子集的相对位置,/nx)为所述所选分子的所述第二组成部分的第二线图数据结构中表示的每个第二归纳连接的子图,在所述数据库中创建和存储包括第二分子量字段、第二顶点数据字段和第二边缘数据字段的第二ICS记...

【技术特征摘要】
【国外来华专利技术】20180611 US 62/683,582;20181029 US 62/752,152;20181.一种标识所选分子的子结构的系统,所述系统包括:
a)微处理器;
b)存储器;
c)所述存储器中的应用程序,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)在所述存储器中接收和存储所选分子数据,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中所述最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)所述所选分子的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及所述最小可分解的单位和所述键之间的连接,和(E)所述所选分子中的割点,其中,所述割点的去除将分子分成第一组成部分和第二组成部分,
ii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中的最小可分解的单位的第一键,
iii)基于所述第一MCU图数据,在所述存储器中生成和存储所述所选分子的所述第一组成部分的第一线图数据结构,所述第一线图数据结构填充有表示所述第一MCU图的第一线图的第一线图数据,所述第一线图具有多个第一LG顶点和多个第一LG边缘,每个第一LG顶点对应于所述第一MCU图中的第一MCU图边缘并且每个第一LG边缘对应于所述第一MCU图中通过所述第一MCU图边缘连接在一起的一对第一MCU图顶点,
iv)针对所述所选分子的所述第一组成部分的所述第一线图数据结构中的所述第一线图数据执行图遍历算法,以确定所述第一线图的多个第一归纳连接的子图,每个第一归纳连接的子图包括所述第一线图中的第一LG顶点和第一LG边缘的第一连接子集,以及第一LG顶点和第一LG边缘的所述第一连接子集的第一物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第一连接子集,以及所述所选分子中最小可分解的单位和键的所述第一连接子集的相对位置,
v)为所述所选分子的所述第一组成部分的第一线图数据结构中表示的每个第一归纳连接的子图,在数据库中创建和存储包括第一分子量字段、第一顶点数据字段和第一边缘数据字段的第一ICS记录,其中所述第一顶点数据字段填充有第一顶点值,所述第一顶点值被配置为指示所述第一归纳连接的子图中每一个第一LG顶点的第一顶点位置,并且所述第一边缘数据字段填充有第一边缘值,所述第一边缘值被配置为指示所述第一归纳连接的子图中的每一个第一LG边缘相对于所述第一LG顶点的第一边缘位置,
vi)为所述所选分子的所述第一组成部分的所述第一线图数据结构中的每个第一ICS记录,基于所述所选分子的所述所选分子数据和所述第一ICS记录中的所述第一顶点值和所述第一边缘值,在所述第一分子量字段中计算和存储该第一ICS记录的所述第一归纳连接的子图的第一总分子量,
vii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的所述第二组成部分的第二最小可分解的单位图数据结构,所述第二最小可分解的单位图数据结构填充有表示所述第二组成部分的第二MCU图的第二MCU图数据,所述第二MCU图具有多个第二MCU图顶点和多个第二MCU图边缘,每个第二MCU图顶点对应于所述第二组成部分的最小可分解的单位并且每个第二MCU图边缘对应于连接所述第二组成部分中的最小可分解的单位的第二键,
viii)基于所述第二MCU图数据,在所述存储器中生成和存储所述所选分子的所述第二组成部分的第二线图数据结构,所述第二线图数据结构填充有表示所述第二MCU图的第二线图的第二线图数据,所述第二线图具有多个第二LG顶点和多个第二LG边缘,每个第二LG顶点对应于所述第二MCU图中的所述第二MCU图边缘并且每个第二LG边缘对应于所述第二MCU图中通过所述第二MCU图边缘连接在一起的一对第二MCU图顶点,
ix)针对所述所选分子的所述第二组成部分的所述第二线图数据结构中的所述第二线图数据执行图遍历算法,以确定所述第二线图的多个第二归纳连接的子图,每个第二归纳连接的子图包括所述第二线图中的第二LG顶点和第二LG边缘的第二连接子集,以及第二LG顶点和第二LG边缘的所述第二连接子集的第二物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第二连接子集,和所述所选分子中最小可分解的单位和键的所述第二连接子集的相对位置,
x)为所述所选分子的所述第二组成部分的第二线图数据结构中表示的每个第二归纳连接的子图,在所述数据库中创建和存储包括第二分子量字段、第二顶点数据字段和第二边缘数据字段的第二ICS记录,其中,所述第二顶点数据字段填充有第二顶点值,所述第二顶点值被配置为指示所述第二归纳连接的子图中的每一个第二LG顶点的第二顶点位置,并且所述第二边缘数据字段填充有第二边缘值,所述第二边缘值配置为指示所述第二归纳连接的子图中的每一个第二LG边缘相对于第二LG顶点的第二边缘位置,和
xi)为所述所选分子的所述第二组成部分的所述第二线图数据结构中的每个第二ICS记录,基于所述所选分子的所述所选分子数据和所述第二ICS记录中的第二顶点值和第二边缘值,在所述第二分子量字段中计算和存储该第二ICS记录的第二归纳连接的子图的第二总分子量;和
d)用户界面,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)从终端用户接收查询分子量,
ii)搜索所述数据库,以标识在所述第一分子量字段中具有匹配所述查询分子量的第一总分子量的第一ICS记录,
iii)搜索所述数据库,以标识在所述第二分子量字段中具有匹配所述查询分子量的第二总分子量的第二ICS记录,
iv)使用标识的第一ICS记录的所述第一顶点数据字段中的第一顶点值和所述第一边缘数据字段中的第一边缘值,以在显示装置上产生和显示所述第一归纳连接的子图的第一图形表示,所述第一归纳连接的子图的第一图形表示对应于具有匹配所述查询分子量的所述第一总分子量的所述第一ICS记录,
v)使用标识的第二ICS记录的所述第二顶点数据字段中的第二顶点值和所述第二边缘数据字段中的第二边缘值,以在显示装置上生成和显示所述第二归纳连接的子图的第二图形表示,所述第二归纳连接的子图的所述第二图形表示对应于具有匹配所述查询分子量的第二总分子量的所述第二ICS记录,
vi)通过从所述查询分子量为割点减去分子量计算调整的查询分子量,
vii)为所述所选分子的所述第一组成部分标识第一局部ICS记录,所述第一局部ICS记录相对于所述第一组成部分的所有其他分子量字段中的所有其他分子量,在所述第一分子量字段中具有最低的第一分子量,
viii)通过从所述调整的查询分子量减去所述所选分子的所述第一组成部分的第一局部ICS记录的最低第一分子量,计算修改的查询分子量,
ix)使用修改的查询分子量搜索所述所选分子的所述第二组成部分的ICS记录,以标识所述所选分子的所述第二组成部分的第二局部ICS记录,所述第二局部ICS记录在所述第二分子量字段中具有当与所述第一组成部分的所述第一局部ICS记录的所述第一分子量组合时匹配所述修改的查询分子量的第二分子量,
x)使用所述第一局部ICS记录和所述第二局部ICS记录的所述顶点数据字段中的所述顶点值、所述第一局部ICS记录和所述第二局部ICS记录的所述边缘数据字段中的所述边缘值、所述割点和所述所选分子数据,在所述显示装置上生成和显示所述所选分子的所述第一组成部分和所述第二组成部分的组合的归纳连接的子图的图形表示,其中通过将所述第一局部ICS记录的所述归纳连接的子图和所述第二局部ICS记录的所述归纳连接的子图连接在一起而产生组合的归纳连接的子图,
xi)用另一第一ICS记录替换所述第一局部ICS记录,其中所述另一第一ICS记录包括所述第一分子量字段中相对于所述第一局部ICS记录的所述分子量字段中的分子量的下一个最低的第一分子量,和
xii)重复上面的步骤viii)至步骤xi)直到所述所选分子的所述第一组成部分的第一ICS记录的所述第一分子量字段中的每个第一分子量已经用于进行所述步骤viii)至步骤xi)。


2.根据权利要求1所述的系统,进一步包括所述应用程序中的程序指令,所述程序指令当通过所述微处理器执行时,使得所述微处理器:
a)接收所述查询分子量的指定容差;
b)使用所述指定容差计算和限定搜索所述数据库的查询分子量的范围;
c)基于所述查询分子量和范围搜索所述数据库,以标识在所述数据库中的每个ICS记录,所述每个ICS记录具有在所述分子量字段中落入限定的分子量的范围内的总分子量和
d)为每个标识的ICS记录,将所述顶点数据字段中的所述顶点值和所述边缘数据字段中的所述边缘值传输至所述用户界面,用于呈现至终端用户。


3.根据权利要求1所述的系统,其中,通过分析存储在链表、或数组、或邻接矩阵、或图形图像文件、或化学绘图文件、或电子表格文件、或文本文件、或CSV文件、或.CDX文件、或.CDXML文件、或.MOL文件、或.SDM文件、或CAD文件、或二进制数据文件中的信息而接收所述所选分子数据。


4.根据权利要求1所述的系统,其中,所述最小可分解的单位和键的集合的所述连接子集为所述所选分子的代谢产物、或所述所选分子的代谢副产物、或所述所选分子的气相碎片、或所述所选分子的降解物、或所述所选分子的子结构。


5.根据权利要求1所述的系统,其中,所述MCU图数据结构为数组、邻接矩阵、邻接表、关联矩阵或关联表。


6.根据权利要求1所述的系统,其中,所述线图数据结构为数组、邻接矩阵、邻接表、关联矩阵或关联表。


7.根据权利要求1所述的系统,其中,所述图遍历算法为深度优先搜索算法、或广度优先搜索算法、或倒序搜索算法、或树搜索算法、或以上的多个图遍历算法中的两个的组合。


8.根据权利要求1所述的系统,其中,所述所选分子为小分子。


9.根据权利要求1所述的系统,其中,所述所选分子为大分子。


10.根据权利要求9所述的系统,其中,所述大分子为蛋白质、核酸、寡核苷酸、多核苷酸、多糖或合成的聚合物。


11.根据权利要求1所述的系统,其中:
a)所述所选分子数据包括元素组成数据,其表示(A)每个最小可分解的单位中元素单位的集合,(B)连接最小可分解的单位中元素单位的集合的元素键的集合,(C)每个元素单位的元素分子量,和(D)所述最小可分解的单位的MCU连接性特征,所述MCU连接性特征指示所述最小可分解的单位中元素单位和元素键的相对位置以及所述最小可分解的单位中元素单位和元素键之间的连接;
b)在所述数据库中创建的ICS记录进一步包括填充有一个或多个元素单位标识符的元素单位字段;和
c)所述应用程序进一步包括程序指令,所述程序指令当通过微处理器执行时,将使得所述微处理器:
i)从所述终端用户接收查询元素单位,
ii)基于所述查询元素单位搜索所述数据库,以标识在所述元素单位字段中具有匹配所述查询元素单位的元素单位标识符的ICS记录,和
iii)将标识的ICS记录的所述顶点数据字段中的所述顶点值和所述边缘数据字段中的所述边缘值传输至所述用户界面,用于在由终端用户操作的显示装置上呈现。


12.根据权利要求1所述的系统,其中:
a)在数据库中创建的每个ICS记录进一步包括生物转化计数字段;和
b)所述用户界面进一步包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)从所述终端用户接收最大的生物转化计数,和
ii)基于所述查询质量和所述最大的生物转化计数,搜索数据库,以标识ICS记录,所述ICS记录具有所述分子量字段中的分子量值和所述生物转化计数字段中的生物转化计数值,所述分子量值匹配所述查询质量,所述生物转化计数值不超过生物转化计数最大值。


13.根据权利要求1所述的系统,其中:
a)在所述数据库中创建的每个ICS记录进一步包括生物转化计数字段;和
b)所述用户界面进一步包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)基于所述每个ICS记录的生物转化计数字段,确定所述第一归纳连接的子图、第二归纳连接的子图和组合的归纳连接的子图之间的排列顺序,和
ii)将所述第一归纳连接的子图的第一图形表示、所述第二归纳连接的子图的第二图形表示和所述组合的归纳连接的子图的图形表示按照所述排列顺序显示在所述显示装置上。


14.一种使用微处理器生成数据库以利于标识所选分子的子结构的系统,所述系统包括:
a)存储器;
b)微处理器;
c)接收和存储所选分子数据的输入模块,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)位于所述所选分子中的割点,所述割点在被去除时将所述所选分子分成第一组成部分和第二组成部分,和(E)所述所选分子中最小可分解的单位和键的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及最小可分解的单位和键之间的连接;
d)MCU图数据结构生成器,其配置为在所述存储器中创建和存储i)所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中最小可分解的单位的第一键;和ii)所述所选分子的第二组成部分的第二最小可分解的单位图数据结构,所述第二最小可分解的单位图数据结构填充有表示所述第二组成部分的第二MCU图的第二MCU图数据,所述第二MCU图具有多个第二MCU图顶点和多个第二MCU图边缘,每个第二MCU图顶点对应于所述第二组成部分的最小可分解的单位并且每个第二MCU图边缘对应于连接所述第二组成部分中的最小可分解的单位的第二键;
e)线图数据结构生成器,其配置为i)基于所述第一MCU图数据,在所述存储器中生成和存储所述所选分子的所述第一组成部分的第一线图数据结构,所述第一线图数据结构填充有表示所述第一MCU图的第一线图的第一线图数据,所述第一线图具有多个第一LG顶点和多个第一LG边缘,每个第一LG顶点对应于所述第一MCU图中的所述第一MCU图边缘并且每个第一LG边缘对应于所述第一MCU图中通过所述第一MCU图边缘连接在一起的一对第一MCU图顶点;和ii)基于所述第二MCU图数据,在所述存储器中生成和存储所述所选分子的第二组成部分的第二线图数据结构,所述第二线图数据结构填充有表示所述第二MCU图的第二线图的第二线图数据,所述第二线图具有多个第二LG顶点和多个第二LG边缘,每个第二LG顶点对应于所述第二MCU图中的第二MCU图边缘并且每个第二LG边缘对应于所述第二MCU图中通过所述第二MCU图边缘连接在一起的一对第二MCU图顶点;
f)图遍历模块,其配置为i)针对所述所选分子的所述第一组成部分的所述第一线图数据结构中的所述第一线图数据执行图遍历算法,以确定所述第一线图的多个第一归纳连接的子图,每个第一归纳连接的子图包括所述第一线图中的第一LG顶点和第一LG边缘的第一连接子集,以及第一LG顶点和第一LG边缘的所述第一连接子集的第一物理布置,其一起唯一地对应于最小可分解的单位和键的集合的第一连接子集,以及所述所选分子中最小可分解的单位和键的所述第一连接子集的相对位置,和ii)针对所述所选分子的所述第二组成部分的所述第二线图数据结构中的所述第二线图数据执行图遍历算法,以确定所述第二线图的多个第二归纳连接的子图,每个第二归纳连接的子图包括所述第二线图中的第二LG顶点和第二LG边缘的第二连接子集,以及第二LG顶点和第二LG边缘的所述第二连接子集的第二物理布置,其一起唯一地对应于最小可分解的单位和键的集合的第二连接子集,和所述所选分子中最小可分解的单位和键的所述第二连接子集的相对位置;和
g)子图数据库生成器,所述子图数据库生成器
i)为所述所选分子的所述第一组成部分的所述第一线图数据结构中表示的每个第一归纳连接的子图,在子图数据库中创建包括第一分子量字段、第一顶点数据字段和第一边缘数据字段的第一ICS记录,其中所述第一顶点数据字段填充有第一顶点值,其配置为指示所述第一归纳连接的子图中每一个第一LG顶点的第一顶点位置,并且所述第一边缘数据字段填充有第一边缘值,其配置为指示所述第一归纳连接的子图中的每一个第一LG边缘相对于所述第一LG顶点的第一边缘位置,和
ii)为所述所选分子的第二组成部分的所述第二线图数据结构中表示的每个第二归纳连接的子图,在子图数据库中创建包括第二分子量字段、第二顶点数据字段和第二边缘数据字段的第二ICS记录,其中所述第二顶点数据字段填充有第二顶点值,所述第二顶点值配置为指示所述第二归纳连接的子图中的每一个第二LG顶点的第二顶点位置,并且所述第二边缘数据字段填充有第二边缘值,所述第二边缘值配置为指示第二归纳连接的子图中的每一个第二LG边缘的相对于第二LG顶点的第二边缘位置;和
h)分子量计算器,其i)为所述所选分子的所述第一组成部分的所述第一线图数据结构中的每个第一ICS记录,基于所述所选分子的所述所选分子数据和所述第一ICS记录中的所述第一顶点值和所述第一边缘值,在所述第一分子量字段中计算和存储该第一ICS记录的第一归纳连接的子图的第一总分子量;和ii)为所述所选分子的所述第二组成部分的所述...

【专利技术属性】
技术研发人员:A·弗里德曼A·巴格奇于翔M·卡西拉
申请(专利权)人:默沙东有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1