基于机器学习和分子模拟的用于增强结合和活性预测的方法技术

技术编号:27011263 阅读:30 留言:0更新日期:2021-01-08 17:22
本申请示出了根据本发明专利技术实施方案的用于分子模拟的系统和方法。一个实施方案包括一种用于预测配体与受体之间的关系的方法。所述方法包括以下步骤:鉴定受体的多种构象;计算所述多种构象中的每一种与一组一种或多种配体的对接评分,以及预测一组一种或多种配体与受体的多种构象之间的关系。

【技术实现步骤摘要】
【国外来华专利技术】基于机器学习和分子模拟的用于增强结合和活性预测的方法相关申请的交叉引用本申请基于35U.S.C§119(e)要求于2018年3月5日提交的名称为“基于机器学习和分子模拟的用于增强结合和活性预测的方法”的美国临时专利申请号62/638,805的优先权。由此,美国临时专利申请号62/638,805的公开内容通过引用整体并入本文用于所有目的。
本专利技术总体上涉及机器学习方法,并且更具体地涉及机器学习在分子模拟中的用途。
技术介绍
一类蛋白质,即G-蛋白质偶联受体(GPCR),包含所有FDA批准药物中超过三分之一的靶标。一种这样的GPCR,即μ阿片类受体(μOR),体现了现有GPCR药物的优缺点。阿片类慢性止痛药(例如吗啡和氢可酮)是μOR激动剂,可达到止痛的主要治疗目的,但会引起严重的副作用,例如呼吸抑制和成瘾。2015年,超过3万美国人死于阿片类药物过量,高于五年前的仅2万。在过去的一个世纪中,药物化学家力求合成没有依赖性问题的阿片类镇痛药,然而却是徒劳的。
技术实现思路
本专利技术示出了根据本专利技术的实施方案的用于分子模拟的系统和方法。一个实施方案包括用于预测配体与受体之间的关系的方法。该方法包括以下步骤:鉴定受体的多种构象;计算该多种构象中的每一种与一组一种或多种配体的对接评分;以及预测该组一种或多种配体与该受体的多种构象之间的关系。在进一步的实施方案中,多种构象包括至少一种非结晶状态。在另一个实施方案中,鉴定多种构象包括通过模拟受体与配体的相互作用来产生模拟数据。在又进一步的实施方案中,鉴定多种构象还包括对模拟数据执行聚类操作以鉴定所述多种构象。在又一个实施方案中,聚类操作是小批量k均值聚类(minibatchk-meansclustering)操作。在又进一步的实施方案中,鉴定多种构象还包括对模拟数据执行降维操作。在另一个附加实施方案中,鉴定多种构象包括鉴定用于多种构象中的每一种构象的一组反应坐标。在进一步的附加实施方案中,计算对接评分包括模拟配体组和多种构象中的每一种的对接。再次在另一个实施方案中,计算对接评分包括建立对接评分的特征矩阵,其中预测关系包括将特征矩阵输入到机器学习模型中。再次在进一步的实施方案中,机器学习模型包括随机森林模型。在又一个实施方案中,随机森林的pIC50截止值为8.0(10nM)。在进一步的实施方案中,随机森林是第一随机森林模型,其中机器学习模型还包括第二随机森林模型。在另一个附加实施方案中,第一随机森林模型用于结合,第二随机森林模型用于激动。在进一步附加的实施方案中,将第一随机森林模型和第二随机森林模型应用于库配体,以便分别从第一随机森林模型和第二随机森林模型两者生成最终评分。再次在又一个实施方案中,该方法还包括用于用来自具有已知药理性质的配体的数据库的配体训练机器学习模型的步骤。再次在进一步的实施方案中,预测该关系包括确定配体是否为受体的激动剂。在另一个附加的实施方案中,该方法进一步包括以下步骤:基于预测的关系鉴定一组一种或多种候选配体,并物理测试该组候选配体与受体的反应。在进一步附加的实施方案中,预测该关系包括预测该组配体与多种构象中的每一种构象的关系,并基于对多种构象预测的关系预测该组配体与受体的聚集关系。附加的实施方案和特征部分地在随后的描述中阐述,并且部分地在阅读说明书时对于本领域技术人员将变得显而易见,或者可以通过实施本专利技术而获悉。通过参考构成本公开的一部分的说明书和附图的其余部分,可以实现对本专利技术的本质和优点的进一步理解。附图说明专利或申请文件包含至少一个彩色的附图。专利局将依请求和支付必要的费用提供带有彩色附图的本专利或专利申请公开的副本。参考以下附图和数据图,将更全面地理解说明书和权利要求,这些附图和数据图被呈现为本专利技术的示例性实施方案,并且不应被解释为对本专利技术范围的完整阐述。图1示出了μOR的各种状态的实例。图2示出了μOR的自由能态的可视化。图3示出了根据本专利技术一些实施方案的提供配体发现的系统的实例。图4示出了根据本专利技术的几个实施方案的配体发现元件的实例。图5示出了根据本专利技术的实施方案的用于鉴定候选配体的配体发现应用的实例。图6概念性地示出了根据本专利技术的实施方案的用于配体发现的流程方法的流程图。图7示出了根据本专利技术的实施方案的MOR-1结合物的筛选的实例。图8A-8D示出了FMP1-FMP32的结构和分子量。图9示出了根据本专利技术的实施方案,在来自CHO细胞的膜中用FMP4抗125I-IBNtxA(0.1nM)的竞争研究。具体实施方式根据本专利技术的某些实施方案的系统和方法可以帮助转化研究人员鉴定新的G-蛋白偶联受体(GPCR)药物骨架。尽管在合成现有化学型衍生物的药物化学方面做出了巨大努力,但目前FDA批准的阿片类药物仍然存在严重的副作用,限制了其在治疗急性和慢性疼痛中的效用。根据本专利技术的几个实施方案的方法利用晶体学和分子建模以及机器学习来探索在μ阿片类受体(μOR)上具有活性的分子的先前未知的化学空间。尽管参考μOR描述了许多实例,但是本领域技术人员将容易理解,根据本专利技术的几个实施方案的方法可以容易地应用于期望具有任何种类的构象可塑性的任何受体,包括其他蛋白质、酶、GPCR、激酶、离子通道和核受体。目前已知的阿片类物质的很大一部分是两种骨架(吗啡和芬太尼)之一的类似物。目前已知的绝大多数阿片类物质都集中在叔胺氮基序上。不同于这种具有百年历史的产生衍生物的策略,根据本专利技术的一些实施方案的系统和方法可以用于打开化学空间的全新区域来开发新型的μ阿片类物质。在一些实施方案中,本公开提供了可用于开发用于GPCR、激酶、离子通道和核受体的新型配体的系统和方法。从根本上开发新分子需要创造性的方法来发现它们。几十年来,研究人员使用三种主要的药物发现方法:结构生物学(例如晶体学)、分子模拟(例如分子动力学,对接)和机器学习(例如定量结构-活性关系(QuantitativeStructure-ActivityRelationship,QSAR),随机森林等)。但是,这些方法被独立使用,因为还没有可以综合这些看似正交的方法的方案。在一些实施方案中,新颖的流程方法利用所有这些手段,以大大提高我们在药物设计中的预测能力。该方案的成功更广泛地支持了蛋白质功能的一个关键假设:蛋白质受体在其功能职责上代表了一个复杂的构象图景。计算化学家通常通过针对蛋白质的晶体结构虚拟筛选化合物来分析候选药物,尽管事实是某些靶标(例如μ阿片类受体和GPCR家族的其他成员)跨越了许多非晶体状态。本专利技术的一些实施方案提供了一种用于发现蛋白质(例如μOR)的新构象状态的方法,所述方法利用分子动力学模拟,然后使用机器学习来学习配体-结构关系从而预测配体功能。根据本专利技术的几个实施方案的方法通过机器学习利用蛋白质的构象可塑性来系统地发现新本文档来自技高网...

【技术保护点】
1.预测配体与受体之间的关系的方法,所述方法包括:/n鉴定受体的多种构象;/n计算所述多种构象中的每一种和一组一种或多种配体的对接评分;和/n预测一组一种或多种配体与所述受体的多种构象之间的关系。/n

【技术特征摘要】
【国外来华专利技术】20180305 US 62/638,8051.预测配体与受体之间的关系的方法,所述方法包括:
鉴定受体的多种构象;
计算所述多种构象中的每一种和一组一种或多种配体的对接评分;和
预测一组一种或多种配体与所述受体的多种构象之间的关系。


2.根据权利要求1所述的方法,其中所述多种构象包括至少一种非晶体状态。


3.根据权利要求1所述的方法,其中鉴定所述多种构象包括通过模拟所述受体与配体的相互作用来产生模拟数据。


4.根据权利要求3所述的方法,其中鉴定所述多种构象还包括对所述模拟数据执行聚类操作以鉴定所述多种构象。


5.根据权利要求4所述的方法,其中所述聚类操作是小批量k均值聚类操作。


6.根据权利要求3所述的方法,其中鉴定所述多种构象还包括对所述模拟数据执行降维操作。


7.根据权利要求1所述的方法,其中鉴定所述多种构象包括针对所述多种构象中的每一种构象鉴定一组反应坐标。


8.根据权利要求1所述的方法,其中计算对接评分包括模拟所述一组配体与所述多种构象中的每一种的对接。


9.根据权利要求1所述的方法,其中计算对接评分包括建立对接评分的特征矩阵,其中预测所述关系包括将所述特征矩阵输入到机器学习模型中。


10.根据权利要求9所述的方法,其中所述机器学习模型包括随机森林模型。


11.根据权利要求10所述的方法,其中所述随机森林的pIC50截止值为8.0(10nM)。


12.根据权利要求10所述的方法,其中所述随机森林是第一随机森林模型,其中所述机器学习模型还包括第二随机森林模型。


13.根据权利要求12所述的方法,其中所述第一随机森林模型用于结合,并且所述第二随机森林模型用于激动。


14.根据权利要求13所述的方法,其中将所述第一随机森林模型和所述第二随机森林模型应用于库配体,以便分别从所述第一随机森林模型和所述第二随机森林模型两者生成最终评分。


15.根据权利要求9所述的方法,其进一步包括使用来自具有已知药理性质的配体的数据库的配体训练所述机器学习模型。


16.根据权利要求1所述的方法,其中预测所述关系包括确定所述配体是否是所述受体的激动剂。


17.根据权利要求1所述的方法,所述方法还包括:
基于预测的关系鉴定一组一种或多种候选配体;和
物理测试一组候选配体与受体的反应。


18.根据权利要求1所述的方法,其中预测所述关系包括:
预测一组配体与多种构象中的每一种构象的关系;和
基于多种构象的预测关系,预测一组配体和所述受体的聚集关系。


19.一种用于预测配体与受体之间的关系的系统,所述系统包括:
一个或多个处理器,所述一个或多个处理器被单独或共同设置为:
鉴定受体的多种构象;
计算多种构象中的每一种和一组一种或多种配体的对接评分;和
预测一组一种或多种配体与受体的多种构象之间的关系。


20.根据权利要求19所述的系统,其中所述多种构象包括至少一种非晶体状态。


21.根据权利要求19所述...

【专利技术属性】
技术研发人员:E·N·费恩伯格V·S·潘德
申请(专利权)人:斯坦福大学托管董事会
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1