System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
【国外来华专利技术】
本文描述的主题一般涉及蛋白质分子的构象中的一个或多个结合位点的识别。
技术介绍
1、分子结合是其中两个或更多个分子(例如,蛋白质、配体等)可相互作用以形成稳定分子结构的过程。例如,分子结合可包括第一分子的一部分与第二分子的一部分之间的化学键合。第一分子的结合至第二分子的部分可以包括多个结合位点。例如,在蛋白质-配体复合物的情况下,蛋白质分子中的每个结合位点可以包括多个结合残基,这些残基是参与和配体结合的残基。各种现实世界的应用(例如,药物发现等)可能需要识别一个分子中能够与另一分子结合的结合位点。例如,可以利用蛋白质分子中的结合残基的身份来设计可以与蛋白质分子有效地结合的配体。
技术实现思路
1、提供了用于识别蛋白质分子中的结合位点的系统、方法和制品,包括计算机程序产品。在一些示例性实施例中,提供了一种包括至少一个处理器和至少一个存储器的系统。该至少一个存储器可以包括程序代码,该程序代码在由至少一个处理器执行时提供操作。操作可包括:(a)确定针对蛋白质分子的第一构象的第一扰动集,确定第一扰动集包括至少基于蛋白质分子中的至少一部分残基的保护因子来识别一个或多个残基以包括在第一扰动集中,确定第一扰动集进一步包括从第一扰动集中排除至少第一残基,该至少第一残基与第一扰动集中的第二残基的距离未能对应于化合物的一个或多个维度;(b)进行一轮或多轮分子动力学模拟,以生成指示化合物与第一扰动集中的第一多个残基之间相互作用的结果;和(c)至少基于一轮或多轮分子动力学模拟的结果来将扰动集中的第一多个残
2、另一方面,提供了用于识别蛋白质分子中的结合位点的方法。该方法可包括:(a)确定针对蛋白质分子的第一构象的第一扰动集,确定第一扰动集包括至少基于蛋白质分子中的至少一部分残基的保护因子来识别一个或多个残基以包括在第一扰动集中,确定第一扰动集进一步包括从第一扰动集中排除至少第一残基,该至少第一残基与第一扰动集中的第二残基的距离未能对应于化合物的一个或多个维度;(b)进行一轮或多轮分子动力学模拟,以生成指示化合物与第一扰动集中的第一多个残基之间相互作用的结果;和(c)至少基于一轮或多轮分子动力学模拟的结果来将扰动集中的第一多个残基识别为在化合物与蛋白质分子的第一构象之间形成稳定结合。
3、在另一方面,提供了一种计算机程序产品,其包括存储指令的非暂时性计算机可读介质。该指令可以引起可以由至少一个数据处理器执行的操作。操作可包括:(a)确定针对蛋白质分子的第一构象的第一扰动集,确定第一扰动集包括至少基于蛋白质分子中的至少一部分残基的保护因子来识别一个或多个残基以包括在第一扰动集中,确定第一扰动集进一步包括从第一扰动集中排除至少第一残基,该至少第一残基与第一扰动集中的第二残基的距离未能对应于化合物的一个或多个维度;(b)进行一轮或多轮分子动力学模拟,以生成指示化合物与第一扰动集中的第一多个残基之间相互作用的结果;和(c)至少基于一轮或多轮分子动力学模拟的结果来将扰动集中的第一多个残基识别为在化合物与蛋白质分子的第一构象之间形成稳定结合。
4、在一些变型中,本文公开的包括以下特征的一个或多个特征可以任选地包括在任何可行的组合中。
5、在一些变型中,与第一构象中的每个残基相关联的保护因子可以对应于处于结合状态的残基的第一能量与处于未结合状态的残基的第二能量之间的差。
6、在一些变型中,至少基于该一个或多个残基的满足一个或多个阈值的保护因子来识别该一个或多个残基以包括在第一扰动集中。
7、在一些变型中,可以至少基于保护因子的值在针对蛋白质分子的第一构象观察到的最大保护因子值的百分位数内来确定该一个或多个残基的保护因子以满足该一个或多个阈值。
8、在一些变型中,可以至少基于最大保护因子值与针对蛋白质分子的第一构象观察到的多个其他保护因子值之间的差的大小来确定百分位数。
9、在一些变型中,百分位数可以是5与20之间的值。
10、在一些变型中,化合物与第一扰动集中的第一多个残基之间的相互作用可以包括第一扰动集中的第一多个残基的至少一部分在蛋白质分子的第一构象内形成诱导配合口袋。
11、在一些变型中,每轮分子动力学模拟可以对偶联的蛋白质-结构-化合物的时间演化进行模拟,该偶联的蛋白质-结构-化合物包括在第一扰动集中所包括的第一多个残基处结合至蛋白质分子的第一构象的化合物。
12、在一些变型中,可以至少基于第一扰动集和指定处于未结合状态的蛋白质分子的第一构象中的原子的空间布置的结构信息来生成偶联的蛋白质-结构-化合物。
13、在一些变型中,确定第一扰动集可以进一步包括从第一扰动集中排除至少第三残基,该第三残基需要阈值数量的重取向以与化合物相互作用。
14、在一些变型中,阈值数量的重取向可通过以下来满足:(i)第三残基中需要重取向以与化合物相互作用的原子的数量,(ii)第三残基中的一个或多个原子需要经历以与化合物相互作用的重取向的角度,和/或(iii)第三残基中的该一个或多个原子需要经历以与化合物相互作用的重取向的距离。
15、在一些变型中,可以从第一扰动集中的第一多个残基的几何中心(cog)和第三残基的α-碳来确定第一向量。可以确定从α-碳到存在于第三残基中的δ-碳、γ-碳或β-碳中的一者的第二向量。可以至少基于由第一向量和第二向量形成的角度满足一个或多个阈值来确定满足阈值数量的重取向。
16、在一些变型中,可以至少基于第三残基是甘氨酸来将第三残基保持在第一扰动集中。
17、在一些变型中,确定第一扰动集可以进一步包括确定第一簇残基的第一质心与第二簇残基的第二质心之间的距离,确定该距离未能对应于化合物的一个或多个维度,并且至少基于第一残基是第一簇残基的一部分而从第一扰动集中排除第一残基。
18、在一些变型中,确定第一扰动集可以进一步包括将聚类技术应用于第一多个残基以将第一多个残基划分成至少第一簇残基和第二簇残基。
19、在一些变型中,聚类技术可以包括k均值聚类、均值偏移聚类、具有噪声的应用的基于密度的空间聚类(dbscan)、使用高斯混合物模型(gmm)的期望-最大化(em)聚类以及凝聚层次聚类中的一种或多种。
20、在一些变型中,确定第一扰动集可以进一步包括确定第一簇残基中的第一数量的残基和第二簇残基中的第二数量的残基,确定第一质心与第一簇中的残基之间的第一平均距离;以及确定第二质心与第二簇中的残基之间的第二平均距离。
21、在一些变型中,确定第一扰动集可以进一步包括至少基于以下确定从第一扰动集中排除第一簇残基:(i)第二簇相比第一簇包括较少的残基,以及(ii)第一簇的第一质心与第二簇的第二质心之间的距离超过第一质心与第一簇中的残基之间的第一平均距离和第二质心与第二簇中的残基之间的第二平均距离之和。
22、在一些变型中,结果可以包括化合物的第一几何中心与本文档来自技高网...
【技术保护点】
1.一种计算机实现方法,其包括:
2.根据权利要求1所述的方法,其中与所述第一构象中的每个残基相关联的所述保护因子对应于处于结合状态的残基的第一能量与处于未结合状态的残基的第二能量之间的差,并且其中至少基于所述一个或多个残基的满足一个或多个阈值的所述保护因子来识别所述一个或多个残基以包括在所述第一扰动集中。
3.根据权利要求1至2中任一项所述的方法,其中每轮分子动力学模拟对偶联的蛋白质-结构-化合物的时间演化进行模拟,所述偶联的蛋白质-结构-化合物包括在所述第一扰动集中所包括的所述第一多个残基处结合至所述蛋白质分子的所述第一构象的所述化合物。
4.根据权利要求1至3中任一项所述的方法,其中确定所述第一扰动集进一步包括从所述第一扰动集中排除至少第三残基,所述第三残基需要阈值数量的重取向以与所述化合物相互作用。
5.根据权利要求4所述的方法,其中所述阈值数量的重取向通过以下来满足:(i)所述第三残基中需要重取向以与所述化合物相互作用的原子的数量,(ii)所述第三残基中的一个或多个原子需要经历以与所述化合物相互作用的重取向的角度,和/或(
6.根据权利要求4至5中任一项所述的方法,其进一步包括:
7.根据权利要求1至6中任一项所述的方法,其中确定所述第一扰动集进一步包括
8.根据权利要求7所述的方法,其中确定所述第一扰动集进一步包括确定所述第一簇残基中的残基的第一数量和所述第二簇残基中的残基的第二数量,
9.根据权利要求1至8中任一项所述的方法,其中所述结果包括以下中的至少一者:(i)所述化合物的第一几何中心与所述第一扰动集中的所述第一多个残基中的多个主链氮(N)原子的第二几何中心之间的第一距离,以及(ii)所述化合物的第一几何中心与所述第一扰动集中的所述第一多个残基中存在的一个或多个酰胺氮原子之间的第二距离。
10.根据权利要求1至9中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括在第一温度进行的第一轮分子动力学模拟和在第二温度进行的第二轮分子动力学模拟。
11.根据权利要求1至10中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括进行第一时间长度的第一轮分子动力学模拟和进行第二时间长度的第二轮分子动力学模拟。
12.根据权利要求1至11中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括针对与所述第一扰动集相关联的所述蛋白质分子的所述第一构象进行的第一轮分子动力学模拟以及针对与第二扰动集相关联的所述蛋白质分子的第二构象进行的第二轮分子动力学模拟。
13.根据权利要求1至12中任一项所述的方法,其中每轮分子动力学模拟使包括在所述第一扰动集中的所述第一多个残基处结合至所述蛋白质分子的所述化合物的偶联的化合物-蛋白质-结构经受不同条件,其中所述一轮或多轮分子动力学模拟的所述结果包括其中所述偶联的化合物-蛋白质-结构解离的一个或多个条件,并且其中所述一个或多个条件包括以下中的至少一者:(i)温度,所述偶联的化合物-蛋白质-结构在所述温度解离,和(ii)时间长度,所述偶联的化合物-蛋白质-结构在所述时间长度后解离。
14.根据权利要求1至13中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括一轮分子动力学模拟,响应于包括在所述第一扰动集中的所述第一多个残基处结合至所述蛋白质分子的所述化合物的偶联的化合物-蛋白质-结构在阈值数量的其他轮分子动力学模拟期间或结束时未能解离而相比另一轮分子动力学模拟在较高的温度进行所述一轮分子动力学模拟。
15.根据权利要求1至14中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括一轮分子动力学模拟,响应于包括在所述第一扰动集中的所述第一多个残基处结合至所述蛋白质分子的所述化合物的偶联的化合物-蛋白质-结构在阈值数量的其他轮分子动力学模拟期间或结束时已经解离而相比另一轮分子动力学模拟在较低的温度进行所述一轮分子动力学模拟。
16.根据权利要求1至15中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括一轮分子动力学模拟,响应于包括在所述第一扰动集中的所述第一多个残基处结合至所述蛋白质分子的所述化合物的偶联的化合物-蛋白质-结构在阈值数量的其他轮分子动力学模拟期间或结束时未能解离而相比另一轮分子动力学模拟进行所述一轮分子动力学模拟持续较长的时间段。
17.根据权利要求1至16中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括一轮分子动力学模拟,响应于包括在所述第一扰动集中的所述第一多个残基处结...
【技术特征摘要】
【国外来华专利技术】
1.一种计算机实现方法,其包括:
2.根据权利要求1所述的方法,其中与所述第一构象中的每个残基相关联的所述保护因子对应于处于结合状态的残基的第一能量与处于未结合状态的残基的第二能量之间的差,并且其中至少基于所述一个或多个残基的满足一个或多个阈值的所述保护因子来识别所述一个或多个残基以包括在所述第一扰动集中。
3.根据权利要求1至2中任一项所述的方法,其中每轮分子动力学模拟对偶联的蛋白质-结构-化合物的时间演化进行模拟,所述偶联的蛋白质-结构-化合物包括在所述第一扰动集中所包括的所述第一多个残基处结合至所述蛋白质分子的所述第一构象的所述化合物。
4.根据权利要求1至3中任一项所述的方法,其中确定所述第一扰动集进一步包括从所述第一扰动集中排除至少第三残基,所述第三残基需要阈值数量的重取向以与所述化合物相互作用。
5.根据权利要求4所述的方法,其中所述阈值数量的重取向通过以下来满足:(i)所述第三残基中需要重取向以与所述化合物相互作用的原子的数量,(ii)所述第三残基中的一个或多个原子需要经历以与所述化合物相互作用的重取向的角度,和/或(iii)所述第三残基中的所述一个或多个原子需要经历以与所述化合物相互作用的重取向的距离。
6.根据权利要求4至5中任一项所述的方法,其进一步包括:
7.根据权利要求1至6中任一项所述的方法,其中确定所述第一扰动集进一步包括
8.根据权利要求7所述的方法,其中确定所述第一扰动集进一步包括确定所述第一簇残基中的残基的第一数量和所述第二簇残基中的残基的第二数量,
9.根据权利要求1至8中任一项所述的方法,其中所述结果包括以下中的至少一者:(i)所述化合物的第一几何中心与所述第一扰动集中的所述第一多个残基中的多个主链氮(n)原子的第二几何中心之间的第一距离,以及(ii)所述化合物的第一几何中心与所述第一扰动集中的所述第一多个残基中存在的一个或多个酰胺氮原子之间的第二距离。
10.根据权利要求1至9中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括在第一温度进行的第一轮分子动力学模拟和在第二温度进行的第二轮分子动力学模拟。
11.根据权利要求1至10中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括进行第一时间长度的第一轮分子动力学模拟和进行第二时间长度的第二轮分子动力学模拟。
12.根据权利要求1至11中任一项所述的方法,其中所述一轮或多轮分子动力学模拟包括针对与所述第一扰动集相关联的所述蛋白质分子的所述第一构象进行的第一轮分子动力学模拟以及针对...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。