System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度学习的蛋白质-小分子配体快速准确对接方法技术_技高网

基于深度学习的蛋白质-小分子配体快速准确对接方法技术

技术编号:43514005 阅读:29 留言:0更新日期:2024-11-29 17:15
本发明专利技术公开了基于深度学习的蛋白质‑小分子配体快速准确对接方法和系统,属于计算机应用技术领域。该方法创新性地采用深度学习技术,实现蛋白质‑小分子配体对接的高效精准预测,通过无向复合图和KNN图表征,深度捕捉分子内部及蛋白质间复杂作用,构建高质量数据输入;双编码器机制解析特征,生成深度嵌入表示,全连接交互图强化相互作用理解;结合构象预测、力场优化与构象对齐,提升对接姿态精确性;混合密度神经网络模型预测距离概率与亲和力,增强预测多样性与准确性。系统模块化设计,跨平台部署便捷,广泛适用于药物研发与生命科学研究,加速新药发现,揭示分子机制,前景广阔。

【技术实现步骤摘要】

本专利技术属于计算机应用,尤其涉及一种基于深度学习的蛋白质-小分子配体快速准确对接方法和系统。


技术介绍

1、分子对接技术是一种重要的计算生物学方法,它通过模拟分子之间的相互作用来预测蛋白质与小分子配体之间的结合姿态和亲和力。这种技术在药物设计、蛋白质功能研究以及生物信息学等领域具有广泛的应用。分子对接方法主要分为刚性对接、半柔性对接和柔性对接三种类型,其中柔性对接由于允许对接过程中研究体系的构象发生自由变化,因此适合精确考察分子间识别情况,但计算量相对较大。在药物设计领域,分子对接技术可以预测药物候选物与靶蛋白的结合模式,为药物发现和设计提供重要指导。通过模拟蛋白质与小分子的相互作用,科学家可以筛选出与特定靶蛋白具有高亲和力的潜在药物分子,从而加速药物研发的进程。虚拟筛选技术作为一种先进的计算方法,其核心价值在于能够高效地从庞大的化合物数据库中筛选出与特定靶蛋白具有生物活性的潜在结合分子。小分子配体对接作为基于结构vs策略的核心组成部分,扮演着至关重要的角色,它不仅涉及蛋白质-小分子配体结合位点的精确构建,还负责预测两者间的结合亲和力,并指导结合位点的选择,从而在整个虚拟筛选流程中发挥着桥梁作用。

2、传统的对接工具诸如autodock 、autodock vina、gold、glide及ledock 等对接软件,依赖启发式搜索策略来遍历并评估众多可能的小分子配体构象,结合精心设计的评分函数,以简化配体姿态的优选与结合强度的估算过程,这种策略显著提升了大规模虚拟筛选任务的执行效率。然而,传统的对接工具和现有的深度学习工具在速度、姿态质量和绑定亲和精度方面会受到限制。特别是当受体需要与数以千计的小分子配体进行对接实验时,这一过程会消耗大量的时间,并且准确性可能不高。深度学习算法如autodock gpu等,它们通过优化算法和利用高性能计算资源,显著提升了虚拟筛选的速度,在预测蛋白质-小分子配体构象方面取得了显著进展,但在绑定亲和度预测的准确性和速度上仍面临挑战。当前模型在复杂体系中的泛化能力有限,且计算成本较高,难以满足大规模虚拟筛选对高效、准确预测的需求。

3、综上所述,传统的对接工具和现有的深度学习工具在速度、姿态质量和绑定亲和精度方面会受到限制,而一个受体往往需要与数以千计的小分子配体之间进行对接的实验,消耗大量的时间,并且准确性不高,因此,持续的技术创新与优化,特别是在模型架构、训练策略及数据处理方法上的改进,对于提升深度学习在药物研发中的应用效果具有至关重要的意义。


技术实现思路

1、针对传统对接与深度学习工具在对接速度、姿态预测精度及绑定亲和度计算上的不足,亟需一种能提升大规模小分子配体与受体对接的效率与准确性从而加速药物研发进程方法的技术现状,本专利技术旨在于提供一种基于深度学习的蛋白质-小分子配体快速准确对接方法和系统。

2、为了达到上述目的,本专利技术采用以下技术方案予以实现:

3、本专利技术提供一种基于深度学习的蛋白质-小分子配体快速准确对接方法,包括:

4、s1,获取蛋白质原始数据和小分子配体原始数据;

5、s2,将小分子配体原始数据和蛋白质原始数据分别结构化表征构建小分子配体无向复合图和蛋白质knn图;

6、s3,将小分子配体无向复合图输入至小分子配体编码器生成小分子配体的更新后嵌入表示;将蛋白质knn图输入至蛋白质编码器生成蛋白质的更新后嵌入表示,然后构建包含小分子配体和蛋白质相互作用信息的全连接交互图;

7、s4,将包含小分子配体和蛋白质相互作用信息的全连接交互图输入至结合构象预测模型预测蛋白质-小分子配体对接姿态构象;

8、s5,将蛋白质-小分子配体对接姿态构象输入至预先训练好的混合密度神经网络打分函数模型,获得小分子配体与蛋白质之间的亲和力得分和可能的结合位姿。

9、s1中,所述蛋白质原始数据和小分子配体原始数据为pdbbind2020数据库通用集去除核心集后的所有的蛋白质-小分子原始数据。

10、s2中,所述构建小分子配体无向复合图和蛋白质knn图包括:

11、s21,将小分子配体原始数据使用torch_geometric软件包结构表征为无向复合图,以原子为节点,共价键为边,其中为节点特征,为边特征,表示原子坐标;

12、s22,将蛋白质原始数据使用蛋白质残基作为节点,并连接前30个最近邻节点构造knn图,节点用残基表示,为蛋白质节点特征,为蛋白质边特征,残基中碳原子坐标作为节点位置 xp,图中的每个节点或边均包含标量特征和矢量特征,为蛋白质节点的标量特征,为蛋白质边的标量特征,为蛋白质节点的矢量特征,为蛋白质边的矢量特征,所述标量特征包括相对距离和位置距离,所述矢量特征包括方向、侧链方向和边方向的单位向量。

13、s3中,所述构建包含小分子配体和蛋白质相互作用信息的全连接交互图包括:

14、s31,将小分子配体的无向复合图数据输入至小分子配体编码器学习小分子配体内部的原子间相互作用,生成小分子配体更新后的嵌入表示,所述嵌入表示包括节点特征,边缘特征及节点位置信息;

15、s32,将蛋白质knn图数据输入至蛋白质编码器,学习蛋白质残基内部的相互作用以及它们之间的拓扑和几何特征,生成蛋白质更新后的嵌入表示,所述嵌入表示包括残基节点邻居节点的信息以及通过蛋白质编码器学习到的拓扑和几何特征;

16、s33,利用s31获得的小分子配体的更新后嵌入表示和s32获得的蛋白质的更新后嵌入表示,构建包含小分子配体和蛋白质相互作用信息的全连接交互图。

17、进一步地,所述蛋白质编码器为几何瓶颈感知机。

18、进一步地,所述小分子配体编码器为图形变压器网络。

19、进一步地,所述边缘特征由边缘类型单键、双键、三键、芳香键以及非键相互作用和节点之间的距离组成。

20、进一步地,s31中,所述生成小分子配体的更新后嵌入表示包括:将分子配体的无向复合图中每个节点和每条边化学键的特征初始化为d维的嵌入向量;将初始化d维的嵌入向量输入至小分子配体编码器中;采用多头自注意力机制处理节点之间的相互作用更新每个节点嵌入表示,获得小分子配体的更新后嵌入表示。

21、进一步地,s32中,所述生成蛋白质的更新后嵌入表示包括:将蛋白质knn图中每个残基节点的标量特征和矢量特征映射与更新、矢量特征降维与扩展以及标量特征的联合集成,生成最终的更新后的矢量特征和标量特征;在蛋白质编码器的每个层中,使用knn算法选择每个节点最近的30个邻居节点,节点和边的信息被连接起来,形成扩展的特征向量,通过蛋白质编码器对扩展的特征向量进行集成和更新,获得蛋白质的更新后嵌入表示。

22、s4中,所述结合构象预测模块为图神经网络模块,该模块由8个基于自注意力改进的图神经网络层组成,所述预测模型预测蛋白质-小分子配体对接姿态构象包括:以包含本文档来自技高网...

【技术保护点】

1.一种基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,包括:

2.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,S1中,所述蛋白质原始数据和小分子配体原始数据为PDBbind2020数据库通用集去除核心集后的所有的蛋白质-小分子原始数据。

3.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,S2中,所述构建小分子配体无向复合图和蛋白质KNN图包括:

4.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,S3中,所述构建包含小分子配体和蛋白质相互作用信息的全连接交互图包括:

5.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,S4中,所述结合构象预测模型为图神经网络模块,该模块由8个基于自注意力改进的图神经网络层组成,所述预测模型预测蛋白质-小分子配体对接姿态构象包括:以包含小分子配体和蛋白质相互作用信息的交互图中更新后的嵌入表示作为输入,通过多层次的自注意力机制预测蛋白质-小分子配体对接姿态;引入门控方程将更新后的嵌入表示与原始嵌入表示结合,优化预测结果,获得预测的蛋白质-小分子配体对接姿态构象。

6.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,在进行S5操作前,还包括对蛋白质-小分子配体对接姿态构象进行优化处理的操作,包括力场优化或构象对齐处理。

7.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,S5中,所述预先训练好的混合密度神经网络打分函数模型,包括:

8.实现权利要求1-7任一所述基于深度学习的蛋白质-小分子配体快速准确对接方法的系统,其特征在于,包括:

9.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行计算机程序时实现权利要求1~7中任意一项所述基于深度学习的蛋白质-小分子配体快速准确对接方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1~7中任意一项所述基于深度学习的蛋白质-小分子配体快速准确对接方法的步骤。

...

【技术特征摘要】

1.一种基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,包括:

2.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,s1中,所述蛋白质原始数据和小分子配体原始数据为pdbbind2020数据库通用集去除核心集后的所有的蛋白质-小分子原始数据。

3.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,s2中,所述构建小分子配体无向复合图和蛋白质knn图包括:

4.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,s3中,所述构建包含小分子配体和蛋白质相互作用信息的全连接交互图包括:

5.如权利要求1所述的基于深度学习的蛋白质-小分子配体快速准确对接方法,其特征在于,s4中,所述结合构象预测模型为图神经网络模块,该模块由8个基于自注意力改进的图神经网络层组成,所述预测模型预测蛋白质-小分子配体对接姿态构象包括:以包含小分子配体和蛋白质相互作用信息的交互图中更新后的嵌入表示作为输入,通过多层次的自注意力机制预测蛋白质-小分子配体对接姿态;引入...

【专利技术属性】
技术研发人员:任胜寒徐欣怡陈雪利郭妍贝刘琦张浩田
申请(专利权)人:西安电子科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1