配体生成的方法及电子设备技术

技术编号:38097361 阅读:9 留言:0更新日期:2023-07-06 09:12
本公开实施例涉及一种配体生成的方法及电子设备。该方法包括:获取经训练的配体生成模型,经训练的配体生成模型基于配体的分解通过对原子位置、原子类型和化学键进行建模而被生成;以及通过使用经训练的配体生成模型,基于目标靶点蛋白得到与目标靶点蛋白对应的目标配体分子。以此方式,本公开的实施例中的配体生成模型考虑了配体的分解且同时对化学键建模,能够生成亲和力更强的目标配体分子。能够生成亲和力更强的目标配体分子。能够生成亲和力更强的目标配体分子。

【技术实现步骤摘要】
配体生成的方法及电子设备


[0001]本公开总体上涉及计算机领域和生物信息领域,并且更具体地涉及配体生成的方法及电子设备。

技术介绍

[0002]生物分子之间的相互作用是实现其生物活性的重要基础。例如,人体可以产生抗体蛋白与入侵的病毒结合从而抑制疾病。在生物制药研究中,可以通过分析那些已知可以互相结合的分子来理解分子间相互作用的物理、化学机制,从而帮助设计出可以与一些特定靶点相结合的新型药物分子。例如,可以确定与靶点蛋白相结合的配体分子,进而基于配体分子来进行药物设计。因此,如何高效地确定能够与靶点蛋白相结合的配体分子是目前需要解决的问题之一。

技术实现思路

[0003]根据本公开的示例实施例,提供了一种配体生成的方法,基于经训练的配体生成模型来得到与目标靶点蛋白对应的目标配体分子,进而能够被应用于药物设计。
[0004]在本公开实施例的第一方面,提供了一种配体生成的方法,包括:获取经训练的配体生成模型,经训练的配体生成模型基于配体的分解通过对原子位置、原子类型和化学键进行建模而被生成;以及通过使用经训练的配体生成模型,基于目标靶点蛋白得到与目标靶点蛋白对应的目标配体分子。
[0005]在本公开实施例的第二方面,提供了一种电子设备,包括:至少一个处理单元;至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,该指令当由至少一个处理单元执行时使得电子设备执行根据本公开的第一方面所描述的方法。
[0006]在本公开实施例的第三方面,提供了一种计算机可读存储介质,该计算机可读存储介质具有在其上存储的机器可执行指令,该机器可执行指令在由设备执行时使该设备执行根据本公开的第一方面所描述的方法。
[0007]在本公开实施例的第四方面,提供了一种计算机程序产品,包括计算机可执行指令,其中计算机可执行指令在被处理器执行时实现根据本公开的第一方面所描述的方法。
[0008]在本公开实施例的第五方面,提供了一种电子设备,包括:处理电路,被配置为执行根据本公开的第一方面所描述的方法。
[0009]提供
技术实现思路
部分是为了以简化的形式来介绍一系列概念,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分不旨在标识本公开的关键特征或必要特征,也不旨在限制本公开的范围。本公开的其它特征将通过以下的描述变得容易理解。
附图说明
[0010]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面
将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
[0011]图1示出了配体分子的分解的示意图;
[0012]图2示出了根据本公开的一些实施例的示例训练过程的示意流程图;
[0013]图3示出了根据本公开的一些实施例的示例使用过程的示意流程图;
[0014]图4示出了根据本公开的一些实施例的生成目标配体分子的示意图;
[0015]图5示出了根据本公开的一些实施例的示例装置的框图;以及
[0016]图6示出了可以用来实施本公开的实施例的示例设备的框图。
具体实施方式
[0017]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0018]在生物制药研究中,药物设计的方法根据其所依赖的数据类型可以包括基于配体的药物设计方法和基于结构的药物设计方法。
[0019]基于配体的药物设计方法收集大量针对某一特定靶点的已有配体信息,并且可以基于配体的结构,探寻与特定靶点结合的分子规律,从而设计或优化配体结构。基于配体的药物设计方法不依赖于靶点的结构数据,仅需要配体信息,因此只能应用于已经拥有大量的配体信息的靶点。可以基于深度学习来构建基于配体的药物设计模型,例如可以用于生成分子的一维的简化分子线性系统(simplified molecular input line entry system,SMILES)或者二维的分子图。
[0020]基于结构的药物设计方法可以根据靶点的三维(3D)结构,设计处能与该3D结构形成紧密相互作用的3D配体结构。具体而言,可以通过配体与靶点的原子之间的相对位置,估计它们之间的相互作用力或适配程度,从而设计和优化3D配体结构。基于结构的药物设计方法同时考虑了靶点和配体的3D结构,通过满足合适的相互作用力目标来实现药物分子设计,因此可适用于任何具有3D结构的靶点。可以基于深度学习来构建基于结构的药物设计模型,例如使用靶点

配体的3D结构作为训练数据,并且该基于结构的药物设计模型旨在生成在靶点结合口袋内的3D配体结构。
[0021]基于深度学习的基于结构的药物设计模型通常将配体分子作为一个整体看待,通过条件变分自编码器、自回归、扩散模型等生成技术,来预测配体原子的类型及位置(如表示为坐标),从而完成3D配体分子的设计任务。目前已有的基于结构的药物设计模型之一是基于扩散模型的3D药物设计模型,其利用扩散模型来建模配体分子中的原子类型和原子坐标的分布。基于扩散模型的3D药物设计模型生成累积误差风险较小,可以更好地利用原子之间的相互作用,生成与靶点亲和力更强的3D配体结构。
[0022]然而,目前的方案还有待进一步提升,例如生成的配体结构与靶点之间的亲和力不足,需要进一步增强。例如,基于扩散模型的3D药物设计模型假设配体分子的先验分布服从标准高斯分布,从而导致生成的配体结构与靶点之间的亲和力不足。由于对配体原子和靶点的位置关系缺乏直接的约束,采样出的配体分子可能会出现与靶点过近甚至碰撞的现象,其引发的互斥作用会导致亲和力不足。
[0023]有鉴于此,本公开的实施例提供了一种配体生成的方案,以解决上述问题以及潜在的其他问题。具体而言,可以基于经训练的配体生成模型来得到与目标靶点蛋白对应的目标配体分子,进而能够被应用于药物设计。
[0024]如在传统药物设计中所考虑的,配体分子(ligand)可以被分为一个骨架结构和多个与骨架相连的官能团。示例性地,骨架结构也可以被称为骨架或支架(scaffold),官能团也可以被称为臂(arms)。从配体与靶点结合相对位置来看,官能团通常与靶点表面紧密接触,起到提高活性的作用,而骨架支撑官能团并将官能团摆放到合适的结合区域。图1示出了配体分子的分解100的示意图。如图1所示,配体分子被分为骨架120和臂140。
[0025]在本公开的实施例中,提供了一种基于扩散模型的配体生成模型,该模型能够同时生成配体分子的原子类型、原子位置、以及化学键,从而提升配体与靶点之间的亲和力。
[0026]本公开的实施例中的术语“靶点”也可以被称为靶点蛋白、蛋白靶点、受体蛋白、受体、蛋白等。术语“配体”也本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种配体生成的方法,包括:获取经训练的配体生成模型,所述经训练的配体生成模型基于配体的分解通过对原子位置、原子类型和化学键进行建模而被生成;以及通过使用所述经训练的配体生成模型,基于目标靶点蛋白得到与所述目标靶点蛋白对应的目标配体分子。2.根据权利要求1所述的方法,其中通过使用所述经训练的配体生成模型基于目标靶点蛋白得到与所述目标靶点蛋白对应的目标配体分子包括:基于所述目标靶点蛋白,确定初始配体分子中的骨架和臂的分解先验分布,所述分解先验分布包括多个原子簇的均值矩阵和协方差矩阵;通过采样,基于所述分解先验分布,确定初始数据,所述初始数据包括初始原子位置、初始原子类型和初始化学键;将所述初始数据输入到所述经训练的配体生成模型,以得到输出数据,所述输出数据包括输出原子位置、输出原子类型和输出化学键;以及基于所述输出数据来生成所述目标配体分子。3.根据权利要求2所述的方法,其中所述初始配体分子包括与所述目标靶点蛋白结合的已知配体分子,并且其中基于所述目标靶点蛋白确定初始配体分子中的骨架和臂的分解先验分布包括:获取与所述目标靶点蛋白结合的所述已知配体分子;基于所述已知配体分子的多个原子与所述目标靶点蛋白的结合口袋之间的结合情况,将所述多个原子分解为多个原子簇,其中所述多个原子簇中的一个原子簇为骨架,所述多个原子簇中的其余原子簇为臂;基于所述多个原子簇的每个原子簇中的原子的坐标,确定所述多个原子簇的每个原子簇的均值矩阵和协方差矩阵;以及基于所述多个原子簇的均值矩阵和协方差矩阵,确定所述分解先验分布。4.根据权利要求2所述的方法,其中所述初始配体分子包括与所述目标靶点蛋白结合的伪配体分子,并且其中基于所述目标靶点蛋白确定初始配体分子中的骨架和臂的分解先验分布包括:通过预测确定与所述目标靶点蛋白结合的所述伪配体分子;基于所述目标靶点蛋白的结合口袋,确定所述伪配体分子中的多个伪配体原子;基于所述多个伪配体原子两两之间的距离,将所述多个伪配体原子分解为多个原子簇,其中所述多个原子簇中的一个原子簇为骨架,所述多个原子簇中的其余原子簇为臂;基于所述多个原子簇的每个原子簇中的原子的坐标,确定所述多个原子簇的每个原子簇的均值矩阵和协方差矩阵;以及基于所述多个原子簇的均值矩阵和协方差矩阵,确定所述分解先验分布。5.根据权利要求2所述的方法,其中通过采样基于所述分解先验分布确定初始数据包括:对所述分解先验分布进行采样,以确定所述初始原子位置;对多个原子类型的集合进行均匀采样,以确定所述初始原子类型;以及对多个化学键的集合进行均匀采样,以确定所述初始化学键。
6.根据权利要求2所述的方法,其中将所述初始数据输入到所述经训练的配体生成模型以得到输出数据包括:将所述初始数据输入到所述经训练的配体生成模型,通过多步去噪过程,得到所述输出数据。7.根据权利要求6所述的方法,其中所述经训练的配体生成模型包括群等变图神经网络,并且在所述多步去噪过程的每一步:将前一步得到的原子位置、原子类型和化学键输入到所述群等变图神经网络,通过去噪,得到中间原子位置、中间原子类型和中间化学键;以及通过对所述中间原子位置施加位置梯度引导,基于所述中间原子位置、所述中间原子类型和所述中间化学键得到用于下一步的原子位置、原子类型和化学键。8.根据权利要求7所述的方法,其中所述位置梯度引导用于在所述中间原子位置的基础上施加位置约束,以使得成键的骨架原子与臂原子之间的距离位于化学键长最小值和化学键长最大值之间,并且未与目标靶点蛋白的原子发生碰撞。9.根据权利要求1所述的方法,还包括:获取包括多个训练数据项的训练数据集,所述多个训练数据项中的每个训练数据项包括靶点样本和对应的配体样本;以及...

【专利技术属性】
技术研发人员:杨雨薇周相鑫鲍宇关嘉麒
申请(专利权)人:北京有竹居网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1