用于数据支持的药物发现的技术制造技术

技术编号:37579213 阅读:17 留言:0更新日期:2023-05-15 07:54
在各种实施方案中,分子探索应用程序在药物发现过程期间确定一个或多个潜在药物候选者。分子探索应用程序基于查询分子规范和编辑启发式生成所推导的分子规范。随后,分子探索应用程序通过映射算法对所述所推导的分子规范执行一个或多个映射操作以生成所映射的分子规范。分子探索应用程序然后基于所述所映射的分子规范对所映射的分子目录执行一个或多个搜索操作以确定所述一个或多个潜在药物候选者。有利地,分子探索应用程序可用于在药物发现过程期间有效地确定另外的药物开发候选者。者。者。

【技术实现步骤摘要】
【国外来华专利技术】用于数据支持的药物发现的技术
[0001]相关申请的交叉引用
[0002]本申请要求于2020年8月18日提交的标题为“Real

Time SAR Search Tool for Very Large Compound Databases”并且序列号为63/067,025的美国临时专利申请的优先权权益,并且要求于2020年11月17日提交的标题为“Techniques For Data

Enabled Drug Discover y”并且序列号为16/950,845的美国专利申请的优先权权益。这些相关申请的主题据此以引用方式并入本文。


[0003]各种实施方案总体涉及计算机科学和生物化学分析,并且更具体地涉及用于数据支持的药物发现的技术。
[0004]相关技术的描述
[0005]药物发现是识别用于治愈、减轻、治疗和/或预防疾病的分子以用于进一步的研究的过程。在典型的药物发现过程的初始阶段期间,许多不同的分子被测试来确定对细胞具有期望效果(称为表现出“目标生物活性”)的感兴趣的药物开发候选者。例如,感兴趣的药物开发候选者可以是一种提高染上特定疾病的细胞的健康状况的药物。基于结构相似的分子通常具有一些相似的生物活性的原理,在识别给定的感兴趣的药物开发候选者之后,在可用分子的任何数量的分子目录中搜索与感兴趣的药物开发候选者在结构上相似的分子。搜索结果中指定的分子成为潜在药物候选者,然后对潜在药物候选者进行评估以识别另外的药物开发候选者,其中每个另外的药物开发候选者具有与感兴趣的药物开发候选者相同的生物活性。一般来说,使用所述过程识别的另外的药物开发候选者中的任何候选者都可具有相对于感兴趣的药物开发候选者改进的物理、化学、生物和/或药理性质。
[0006]在一种确定潜在药物候选者的方法中,相似性软件应用程序基于相似性度量来量化感兴趣的药物开发候选者与任何数量的分子目录中指定的分子中的每一个之间的结构相似性。在一些实施方式中,相似性软件应用程序计算Tanimoto系数的值,所述Tanimoto系数基于一组分子结构片段量化两个分子之间的结构相似性。在此类实施方式中,对于搜索结果中指定的每个分子,相似性软件应用程序将Tanimoto系数的值设置为等于分子与感兴趣的药物开发候选者之间共享的分子结构片段的数量与存在于所述分子和感兴趣的药物开发候选者中的任一者或两者中的分子结构片段的数量的比率。随后,相似性软件应用程序生成指定具有超过最小相似性阈值的Tanimoto系数值的分子的搜索结果。具有超过最小相似性阈值的Tanimoto系数的任何分子被认为是潜在药物候选者。
[0007]基于相似性度量确定潜在药物候选者的一个缺点是,根据相似性度量具有“相似的”分子结构的不同药物不一定共享给定的生物活性。因此,对于给定的药物发现过程,使用特定相似性度量识别的具有与相关的感兴趣的药物开发候选者相同的目标生物活性的潜在药物候选者的部分可能非常低。因此,通常会浪费大量时间和资源来评估最终与给定药物发现过程无关的潜在药物候选者。
[0008]基于相似性度量确定潜在药物候选者的另一个缺点是,由于目录搜索的计算复杂
性与可用分子的总数量成比例,因此全面搜索分子目录所需的时间和计算资源的量可能非常高。例如,使用基于三维形状的相似性度量来评估当前分子目录中所包含的数亿个可用分子可能需要数十年的计算时间。通常,由于时间和计算资源的限制,在给定的药物发现过程期间,只会搜索当前分子目录中指定的分子中的一小部分。
[0009]如前所说明,本领域需要的是用于在药物发现过程期间确定潜在药物候选者的更有效的技术。

技术实现思路

[0010]本专利技术的一个实施方案阐述了一种用于在药物发现过程期间确定一个或多个潜在药物候选者的方法。所述方法包括:基于查询分子规范和编辑启发式生成所推导的分子规范;通过映射算法对所推导的分子规范执行一个或多个映射操作以生成所映射的分子规范;以及基于所映射的分子规范对所映射的分子目录执行一个或多个搜索操作以确定一个或多个潜在药物候选者。
[0011]所公开的技术相对于现有技术的至少一个技术优势是所公开的技术可用于在药物发现过程期间更有效地确定另外的药物开发候选者。在这方面,因为使用所公开的技术实施的相关编辑启发式是为给定的药物发现过程定制的,所以由那些编辑启发式引入的结构变化保留目标生物活性的可能性得以增加。因此,相对于现有技术的方法,使用所公开的技术识别的最终与给定药物发现过程相关的结构上相似的药物候选者的比例通常增加。此外,与现有技术不同,因为不管被搜索的分子的总数如何,所公开技术的计算复杂性保持恒定,所以可减少全面搜索分子目录所需的时间和计算资源的量。特别地,利用所公开的技术,可以给定的交互速率搜索所有可用的分子。这些技术优势提供优于现有技术方法的一个或多个技术改进。
附图说明
[0012]因此,可通过参考各种实施方案来获得可详细理解各种实施方案的上述特征的方式,即对以上简要概述的专利技术概念的更具体描述,这些实施方案中的一些在附图中示出。然而,应当注意,附图仅示出专利技术概念的典型实施方案,因此不应被视为以任何方式限制范围,并且还存在其他等效的实施方案。
[0013]图1是被配置来实施各种实施方案的一个或多个方面的系统的概念性图示;
[0014]图2是根据各种实施方案的图1的推导引擎的更详细的图示;
[0015]图3是根据各种实施方案的图1的搜索结果数据集的更详细的图示;并且
[0016]图4是根据各种实施方案的用于在药物发现过程期间确定潜在药物候选者的方法步骤的流程图。
具体实施方式
[0017]在以下描述中,阐述了许多具体细节以提供对各种实施方案的更透彻理解。然而,对于本领域技术人员将明显的是,专利技术概念可以在没有这些具体细节中的一个或多个具体细节的情况下实践。
[0018]示例性概述
[0019]仅出于解释的目的,本文描述示例性实施方案的概述。在一些实施方案中,所公开的技术可用于在药物发现过程期间从感兴趣的药物开发候选者有效地推导潜在药物候选者。然后可评估潜在药物候选者以确定潜在药物候选者中的哪些是另外的药物开发药物候选者。对于给定的药物发现过程,每种药物开发候选者(例如,感兴趣的药物开发候选者或另外的药物开发候选者)是对细胞具有与药物发现过程的总体目标一致的期望效果的分子。对细胞的期望效果在本文中也称为“目标生物活性”。例如,每种药物开发候选者可提高染上特定疾病的细胞的健康状况。
[0020]在初始化阶段,分子探索应用程序将散列函数应用于任何数量的分子目录以生成所映射的目录。分子目录中的每一个包括表示任何数量的可用分子的可用分子规范。散列函数将分子规范(即,“键”)映射到阵列索引。每个所映射的目录是相关联的分子目录的散列映射,所述散列映射基于相关联的阵列索引将分子目录中所包括的可用分子规范存储在桶中。
[0021]在随后的搜索阶段期间,分子探索应用程序接收任何数量的搜本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种用于在药物发现过程期间确定一个或多个潜在药物候选者的计算机实施的方法,所述方法包括:基于查询分子规范和多个编辑启发式生成多个所推导的分子规范;通过映射算法对所述多个所推导的分子规范执行一个或多个映射操作以生成多个所映射的分子规范;以及基于所述多个所映射的分子规范对所映射的分子目录执行一个或多个搜索操作以确定所述一个或多个潜在药物候选者。2.如权利要求1所述的计算机实施的方法,其还包括通过所述映射算法对与分子目录相关联的多个分子规范执行一个或多个映射操作以生成所述所映射的分子目录。3.如权利要求1所述的计算机实施的方法,其中生成所述多个所推导的分子规范包括将所述多个编辑启发式递归地应用于所述查询分子规范以生成包括所述多个所推导的分子规范的推导树。4.如权利要求1所述的计算机实施的方法,其中生成所述多个所推导的分子规范包括:将包括在所述多个编辑启发式中的第一编辑启发式应用于所述查询分子规范以生成第一所推导的分子规范;以及将包括在所述多个编辑启发式中的第二编辑启发式应用于所述第一所推导的分子规范以生成第二所推导的分子规范。5.如权利要求1所述的计算机实施的方法,其中所述多个编辑启发式包括至少一个编辑启发式,所述至少一个编辑启发式当应用于所述查询分子规范时,将氮或取代基添加到所述查询分子规范、从所述查询分子规范移除氮或取代基或重新定位包括在所述查询分子规范中的取代基以生成所推导的分子规范。6.如权利要求1所述的计算机实施的方法,其中所述多个编辑启发式包括至少一个编辑启发式,所述至少一个编辑启发式当应用于所述查询分子规范时,重新定位包括在所述查询分子规范中的氮以生成表示对应于所述查询分子规范的查询分子的异构体的所推导的分子规范。7.如权利要求1所述的计算机实施的方法,其中所述映射算法包括散列函数,并且所述所映射的分子目录包括散列映射。8.如权利要求1所述的计算机实施的方法,其中执行所述一个或多个搜索操作包括基于包括在所述多个所映射的分子规范中的第一所映射的分子规范对所述所映射的分子目录执行基于散列的搜索,以确定包括在所述多个所推导的分子规范中的第一所推导的分子规范匹配包括在所述所映射的分子目录中的第一分子规范。9.如权利要求8所述的计算机实施的方法,其还包括:对另一个所映射的分子目录执行另一个基于散列的搜索以确定所述第一所推导的分子规范匹配包括在所述另一个所映射的分子目录中的第二分子规范;确定对应于所述所映射的分子目录的第一分子目录具有比对应于所述另一个所映射的分子目录的第二分子目录低的第一偏好排序;以及通过图形用户界面在计算装置上显示对应于所述第一所推导的分子规范的第一所推导的分子是第一潜在药物候选者并且位于所述第二分子目录中。10.如权利要求1所述的计算机实施的方法,其中所述查询分子规范表示与所述药物发
现过程相关联的感兴趣的药物开发候选者。11.一种或多种非暂时性计算机可读介质,其包括指令,所述指令当由一个或多个处理器执行时使所述一个或多个处理器在药物发现过程期间通过执行...

【专利技术属性】
技术研发人员:安德鲁
申请(专利权)人:递归医药公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1