【技术实现步骤摘要】
【国外来华专利技术】用于标识复杂分子子结构的割点法
本专利技术涉及使用割点法标识复杂分子,特别是大分子比如生物分子的子结构的系统、设备和方法。
技术介绍
标识和表征药学化合物的子结构,比如代谢产物,是药物发现的重要部分。理解这种代谢产物的结构并且限定代谢转化的具体的位点对于,例如,指导药物候选物的先导化合物的合成优化是有用的,以克服通常与那些化合物相关的稳定性和毒性问题。在之前不了解它们的结构的情况下,目前的代谢产物标识(MetID)法已经不能系统地表征来自生物基质的大分子,比如治疗性蛋白质和肽(TPP)的代谢产物了。尽管一些现成的小分子MetID软件,比如MASSCAP、SEQUEST和MassMetaSite,用于表征小分子药物和小直链肽的代谢产物,但是已经证实该软件对于标识较大的生物分子(比如大的非直链肽/蛋白质)的代谢产物和其他子结构不切实际或不合适。对于该缺陷,至少有三种原因:(i)最小分子MetID软件对于大分子不能适当地去卷积单同位素峰,其导致错误的输入质量值;(ii)最小分子MetID软件使用为小分子药物设计的基于原子的算法,并且典型的大生物分子,比如TPP,其原子的数量通常比小分子高1-2个数量级,其为这种基于原子的算法引入巨大的计算复杂性;和(iii)用于小分子MetID(比如细胞色素P450代谢途径或质量缺陷过滤器)的信息,不适用于大分子,因为大分子具有常规的小分子软件一般不考虑的不同代谢过程。与分子的基于原子的呈现相关的计算复杂性可干扰或有时阻碍计算机分析。取决于给定的计算机中RAM的量,标识具有 ...
【技术保护点】
1.一种标识所选分子的子结构的系统,所述系统包括:/na)微处理器;/nb)存储器;/nc)所述存储器中的应用程序,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:/ni)在所述存储器中接收和存储所选分子数据,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中所述最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)所述所选分子的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及所述最小可分解的单位和所述键之间的连接,和(E)所述所选分子中的割点,其中,所述割点的去除将分子分成第一组成部分和第二组成部分,/nii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中的 ...
【技术特征摘要】
【国外来华专利技术】20180611 US 62/683,582;20181029 US 62/752,152;20181.一种标识所选分子的子结构的系统,所述系统包括:
a)微处理器;
b)存储器;
c)所述存储器中的应用程序,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)在所述存储器中接收和存储所选分子数据,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中所述最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)所述所选分子的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及所述最小可分解的单位和所述键之间的连接,和(E)所述所选分子中的割点,其中,所述割点的去除将分子分成第一组成部分和第二组成部分,
ii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中的最小可分解的单位的第一键,
iii)基于所述第一MCU图数据,在所述存储器中生成和存储所述所选分子的所述第一组成部分的第一线图数据结构,所述第一线图数据结构填充有表示所述第一MCU图的第一线图的第一线图数据,所述第一线图具有多个第一LG顶点和多个第一LG边缘,每个第一LG顶点对应于所述第一MCU图中的第一MCU图边缘并且每个第一LG边缘对应于所述第一MCU图中通过所述第一MCU图边缘连接在一起的一对第一MCU图顶点,
iv)针对所述所选分子的所述第一组成部分的所述第一线图数据结构中的所述第一线图数据执行图遍历算法,以确定所述第一线图的多个第一归纳连接的子图,每个第一归纳连接的子图包括所述第一线图中的第一LG顶点和第一LG边缘的第一连接子集,以及第一LG顶点和第一LG边缘的所述第一连接子集的第一物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第一连接子集,以及所述所选分子中最小可分解的单位和键的所述第一连接子集的相对位置,
v)为所述所选分子的所述第一组成部分的第一线图数据结构中表示的每个第一归纳连接的子图,在数据库中创建和存储包括第一分子量字段、第一顶点数据字段和第一边缘数据字段的第一ICS记录,其中所述第一顶点数据字段填充有第一顶点值,所述第一顶点值被配置为指示所述第一归纳连接的子图中每一个第一LG顶点的第一顶点位置,并且所述第一边缘数据字段填充有第一边缘值,所述第一边缘值被配置为指示所述第一归纳连接的子图中的每一个第一LG边缘相对于所述第一LG顶点的第一边缘位置,
vi)为所述所选分子的所述第一组成部分的所述第一线图数据结构中的每个第一ICS记录,基于所述所选分子的所述所选分子数据和所述第一ICS记录中的所述第一顶点值和所述第一边缘值,在所述第一分子量字段中计算和存储该第一ICS记录的所述第一归纳连接的子图的第一总分子量,
vii)基于所述所选分子数据,在所述存储器中创建和存储所述所选分子的所述第二组成部分的第二最小可分解的单位图数据结构,所述第二最小可分解的单位图数据结构填充有表示所述第二组成部分的第二MCU图的第二MCU图数据,所述第二MCU图具有多个第二MCU图顶点和多个第二MCU图边缘,每个第二MCU图顶点对应于所述第二组成部分的最小可分解的单位并且每个第二MCU图边缘对应于连接所述第二组成部分中的最小可分解的单位的第二键,
viii)基于所述第二MCU图数据,在所述存储器中生成和存储所述所选分子的所述第二组成部分的第二线图数据结构,所述第二线图数据结构填充有表示所述第二MCU图的第二线图的第二线图数据,所述第二线图具有多个第二LG顶点和多个第二LG边缘,每个第二LG顶点对应于所述第二MCU图中的所述第二MCU图边缘并且每个第二LG边缘对应于所述第二MCU图中通过所述第二MCU图边缘连接在一起的一对第二MCU图顶点,
ix)针对所述所选分子的所述第二组成部分的所述第二线图数据结构中的所述第二线图数据执行图遍历算法,以确定所述第二线图的多个第二归纳连接的子图,每个第二归纳连接的子图包括所述第二线图中的第二LG顶点和第二LG边缘的第二连接子集,以及第二LG顶点和第二LG边缘的所述第二连接子集的第二物理布置,其一起唯一地对应于所述最小可分解的单位和键的集合的第二连接子集,和所述所选分子中最小可分解的单位和键的所述第二连接子集的相对位置,
x)为所述所选分子的所述第二组成部分的第二线图数据结构中表示的每个第二归纳连接的子图,在所述数据库中创建和存储包括第二分子量字段、第二顶点数据字段和第二边缘数据字段的第二ICS记录,其中,所述第二顶点数据字段填充有第二顶点值,所述第二顶点值被配置为指示所述第二归纳连接的子图中的每一个第二LG顶点的第二顶点位置,并且所述第二边缘数据字段填充有第二边缘值,所述第二边缘值配置为指示所述第二归纳连接的子图中的每一个第二LG边缘相对于第二LG顶点的第二边缘位置,和
xi)为所述所选分子的所述第二组成部分的所述第二线图数据结构中的每个第二ICS记录,基于所述所选分子的所述所选分子数据和所述第二ICS记录中的第二顶点值和第二边缘值,在所述第二分子量字段中计算和存储该第二ICS记录的第二归纳连接的子图的第二总分子量;和
d)用户界面,其包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)从终端用户接收查询分子量,
ii)搜索所述数据库,以标识在所述第一分子量字段中具有匹配所述查询分子量的第一总分子量的第一ICS记录,
iii)搜索所述数据库,以标识在所述第二分子量字段中具有匹配所述查询分子量的第二总分子量的第二ICS记录,
iv)使用标识的第一ICS记录的所述第一顶点数据字段中的第一顶点值和所述第一边缘数据字段中的第一边缘值,以在显示装置上产生和显示所述第一归纳连接的子图的第一图形表示,所述第一归纳连接的子图的第一图形表示对应于具有匹配所述查询分子量的所述第一总分子量的所述第一ICS记录,
v)使用标识的第二ICS记录的所述第二顶点数据字段中的第二顶点值和所述第二边缘数据字段中的第二边缘值,以在显示装置上生成和显示所述第二归纳连接的子图的第二图形表示,所述第二归纳连接的子图的所述第二图形表示对应于具有匹配所述查询分子量的第二总分子量的所述第二ICS记录,
vi)通过从所述查询分子量为割点减去分子量计算调整的查询分子量,
vii)为所述所选分子的所述第一组成部分标识第一局部ICS记录,所述第一局部ICS记录相对于所述第一组成部分的所有其他分子量字段中的所有其他分子量,在所述第一分子量字段中具有最低的第一分子量,
viii)通过从所述调整的查询分子量减去所述所选分子的所述第一组成部分的第一局部ICS记录的最低第一分子量,计算修改的查询分子量,
ix)使用修改的查询分子量搜索所述所选分子的所述第二组成部分的ICS记录,以标识所述所选分子的所述第二组成部分的第二局部ICS记录,所述第二局部ICS记录在所述第二分子量字段中具有当与所述第一组成部分的所述第一局部ICS记录的所述第一分子量组合时匹配所述修改的查询分子量的第二分子量,
x)使用所述第一局部ICS记录和所述第二局部ICS记录的所述顶点数据字段中的所述顶点值、所述第一局部ICS记录和所述第二局部ICS记录的所述边缘数据字段中的所述边缘值、所述割点和所述所选分子数据,在所述显示装置上生成和显示所述所选分子的所述第一组成部分和所述第二组成部分的组合的归纳连接的子图的图形表示,其中通过将所述第一局部ICS记录的所述归纳连接的子图和所述第二局部ICS记录的所述归纳连接的子图连接在一起而产生组合的归纳连接的子图,
xi)用另一第一ICS记录替换所述第一局部ICS记录,其中所述另一第一ICS记录包括所述第一分子量字段中相对于所述第一局部ICS记录的所述分子量字段中的分子量的下一个最低的第一分子量,和
xii)重复上面的步骤viii)至步骤xi)直到所述所选分子的所述第一组成部分的第一ICS记录的所述第一分子量字段中的每个第一分子量已经用于进行所述步骤viii)至步骤xi)。
2.根据权利要求1所述的系统,进一步包括所述应用程序中的程序指令,所述程序指令当通过所述微处理器执行时,使得所述微处理器:
a)接收所述查询分子量的指定容差;
b)使用所述指定容差计算和限定搜索所述数据库的查询分子量的范围;
c)基于所述查询分子量和范围搜索所述数据库,以标识在所述数据库中的每个ICS记录,所述每个ICS记录具有在所述分子量字段中落入限定的分子量的范围内的总分子量和
d)为每个标识的ICS记录,将所述顶点数据字段中的所述顶点值和所述边缘数据字段中的所述边缘值传输至所述用户界面,用于呈现至终端用户。
3.根据权利要求1所述的系统,其中,通过分析存储在链表、或数组、或邻接矩阵、或图形图像文件、或化学绘图文件、或电子表格文件、或文本文件、或CSV文件、或.CDX文件、或.CDXML文件、或.MOL文件、或.SDM文件、或CAD文件、或二进制数据文件中的信息而接收所述所选分子数据。
4.根据权利要求1所述的系统,其中,所述最小可分解的单位和键的集合的所述连接子集为所述所选分子的代谢产物、或所述所选分子的代谢副产物、或所述所选分子的气相碎片、或所述所选分子的降解物、或所述所选分子的子结构。
5.根据权利要求1所述的系统,其中,所述MCU图数据结构为数组、邻接矩阵、邻接表、关联矩阵或关联表。
6.根据权利要求1所述的系统,其中,所述线图数据结构为数组、邻接矩阵、邻接表、关联矩阵或关联表。
7.根据权利要求1所述的系统,其中,所述图遍历算法为深度优先搜索算法、或广度优先搜索算法、或倒序搜索算法、或树搜索算法、或以上的多个图遍历算法中的两个的组合。
8.根据权利要求1所述的系统,其中,所述所选分子为小分子。
9.根据权利要求1所述的系统,其中,所述所选分子为大分子。
10.根据权利要求9所述的系统,其中,所述大分子为蛋白质、核酸、寡核苷酸、多核苷酸、多糖或合成的聚合物。
11.根据权利要求1所述的系统,其中:
a)所述所选分子数据包括元素组成数据,其表示(A)每个最小可分解的单位中元素单位的集合,(B)连接最小可分解的单位中元素单位的集合的元素键的集合,(C)每个元素单位的元素分子量,和(D)所述最小可分解的单位的MCU连接性特征,所述MCU连接性特征指示所述最小可分解的单位中元素单位和元素键的相对位置以及所述最小可分解的单位中元素单位和元素键之间的连接;
b)在所述数据库中创建的ICS记录进一步包括填充有一个或多个元素单位标识符的元素单位字段;和
c)所述应用程序进一步包括程序指令,所述程序指令当通过微处理器执行时,将使得所述微处理器:
i)从所述终端用户接收查询元素单位,
ii)基于所述查询元素单位搜索所述数据库,以标识在所述元素单位字段中具有匹配所述查询元素单位的元素单位标识符的ICS记录,和
iii)将标识的ICS记录的所述顶点数据字段中的所述顶点值和所述边缘数据字段中的所述边缘值传输至所述用户界面,用于在由终端用户操作的显示装置上呈现。
12.根据权利要求1所述的系统,其中:
a)在数据库中创建的每个ICS记录进一步包括生物转化计数字段;和
b)所述用户界面进一步包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)从所述终端用户接收最大的生物转化计数,和
ii)基于所述查询质量和所述最大的生物转化计数,搜索数据库,以标识ICS记录,所述ICS记录具有所述分子量字段中的分子量值和所述生物转化计数字段中的生物转化计数值,所述分子量值匹配所述查询质量,所述生物转化计数值不超过生物转化计数最大值。
13.根据权利要求1所述的系统,其中:
a)在所述数据库中创建的每个ICS记录进一步包括生物转化计数字段;和
b)所述用户界面进一步包括程序指令,所述程序指令当通过所述微处理器执行时,将使得所述微处理器:
i)基于所述每个ICS记录的生物转化计数字段,确定所述第一归纳连接的子图、第二归纳连接的子图和组合的归纳连接的子图之间的排列顺序,和
ii)将所述第一归纳连接的子图的第一图形表示、所述第二归纳连接的子图的第二图形表示和所述组合的归纳连接的子图的图形表示按照所述排列顺序显示在所述显示装置上。
14.一种使用微处理器生成数据库以利于标识所选分子的子结构的系统,所述系统包括:
a)存储器;
b)微处理器;
c)接收和存储所选分子数据的输入模块,所述所选分子数据表示(A)所述所选分子中最小可分解的单位的集合,(B)连接所述所选分子中最小可分解的单位的集合的键的集合,(C)每个最小可分解的单位的分子量,(D)位于所述所选分子中的割点,所述割点在被去除时将所述所选分子分成第一组成部分和第二组成部分,和(E)所述所选分子中最小可分解的单位和键的连接性特征,所述连接性特征指示最小可分解的单位和键的相对位置,以及最小可分解的单位和键之间的连接;
d)MCU图数据结构生成器,其配置为在所述存储器中创建和存储i)所述所选分子的第一组成部分的第一最小可分解的单位图数据结构,所述第一最小可分解的单位图数据结构填充有表示所述第一组成部分的第一MCU图的第一MCU图数据,所述第一MCU图具有多个第一MCU图顶点和多个第一MCU图边缘,每个第一MCU图顶点对应于所述第一组成部分的最小可分解的单位并且每个第一MCU图边缘对应于连接所述第一组成部分中最小可分解的单位的第一键;和ii)所述所选分子的第二组成部分的第二最小可分解的单位图数据结构,所述第二最小可分解的单位图数据结构填充有表示所述第二组成部分的第二MCU图的第二MCU图数据,所述第二MCU图具有多个第二MCU图顶点和多个第二MCU图边缘,每个第二MCU图顶点对应于所述第二组成部分的最小可分解的单位并且每个第二MCU图边缘对应于连接所述第二组成部分中的最小可分解的单位的第二键;
e)线图数据结构生成器,其配置为i)基于所述第一MCU图数据,在所述存储器中生成和存储所述所选分子的所述第一组成部分的第一线图数据结构,所述第一线图数据结构填充有表示所述第一MCU图的第一线图的第一线图数据,所述第一线图具有多个第一LG顶点和多个第一LG边缘,每个第一LG顶点对应于所述第一MCU图中的所述第一MCU图边缘并且每个第一LG边缘对应于所述第一MCU图中通过所述第一MCU图边缘连接在一起的一对第一MCU图顶点;和ii)基于所述第二MCU图数据,在所述存储器中生成和存储所述所选分子的第二组成部分的第二线图数据结构,所述第二线图数据结构填充有表示所述第二MCU图的第二线图的第二线图数据,所述第二线图具有多个第二LG顶点和多个第二LG边缘,每个第二LG顶点对应于所述第二MCU图中的第二MCU图边缘并且每个第二LG边缘对应于所述第二MCU图中通过所述第二MCU图边缘连接在一起的一对第二MCU图顶点;
f)图遍历模块,其配置为i)针对所述所选分子的所述第一组成部分的所述第一线图数据结构中的所述第一线图数据执行图遍历算法,以确定所述第一线图的多个第一归纳连接的子图,每个第一归纳连接的子图包括所述第一线图中的第一LG顶点和第一LG边缘的第一连接子集,以及第一LG顶点和第一LG边缘的所述第一连接子集的第一物理布置,其一起唯一地对应于最小可分解的单位和键的集合的第一连接子集,以及所述所选分子中最小可分解的单位和键的所述第一连接子集的相对位置,和ii)针对所述所选分子的所述第二组成部分的所述第二线图数据结构中的所述第二线图数据执行图遍历算法,以确定所述第二线图的多个第二归纳连接的子图,每个第二归纳连接的子图包括所述第二线图中的第二LG顶点和第二LG边缘的第二连接子集,以及第二LG顶点和第二LG边缘的所述第二连接子集的第二物理布置,其一起唯一地对应于最小可分解的单位和键的集合的第二连接子集,和所述所选分子中最小可分解的单位和键的所述第二连接子集的相对位置;和
g)子图数据库生成器,所述子图数据库生成器
i)为所述所选分子的所述第一组成部分的所述第一线图数据结构中表示的每个第一归纳连接的子图,在子图数据库中创建包括第一分子量字段、第一顶点数据字段和第一边缘数据字段的第一ICS记录,其中所述第一顶点数据字段填充有第一顶点值,其配置为指示所述第一归纳连接的子图中每一个第一LG顶点的第一顶点位置,并且所述第一边缘数据字段填充有第一边缘值,其配置为指示所述第一归纳连接的子图中的每一个第一LG边缘相对于所述第一LG顶点的第一边缘位置,和
ii)为所述所选分子的第二组成部分的所述第二线图数据结构中表示的每个第二归纳连接的子图,在子图数据库中创建包括第二分子量字段、第二顶点数据字段和第二边缘数据字段的第二ICS记录,其中所述第二顶点数据字段填充有第二顶点值,所述第二顶点值配置为指示所述第二归纳连接的子图中的每一个第二LG顶点的第二顶点位置,并且所述第二边缘数据字段填充有第二边缘值,所述第二边缘值配置为指示第二归纳连接的子图中的每一个第二LG边缘的相对于第二LG顶点的第二边缘位置;和
h)分子量计算器,其i)为所述所选分子的所述第一组成部分的所述第一线图数据结构中的每个第一ICS记录,基于所述所选分子的所述所选分子数据和所述第一ICS记录中的所述第一顶点值和所述第一边缘值,在所述第一分子量字段中计算和存储该第一ICS记录的第一归纳连接的子图的第一总分子量;和ii)为所述所选分子的所述第二组成部分的所述...
【专利技术属性】
技术研发人员:A·弗里德曼,A·巴格奇,于翔,M·卡西拉,
申请(专利权)人:默沙东有限公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。