一种基于图注意力网络的蛋白质-配体亲和力评价方法技术

技术编号:33134271 阅读:31 留言:0更新日期:2022-04-17 00:56
本发明专利技术公开了一种基于图注意力网络的蛋白质

【技术实现步骤摘要】
一种基于图注意力网络的蛋白质

配体亲和力评价方法


[0001]本专利技术具体涉及一种基于图注意力网络的蛋白质

配体亲和力评价方法,属于蛋白质

配体亲和力评价的


技术介绍

[0002]评估蛋白质

配体的相互作用是基于结构药物设计的基石。打分函数是评价蛋白质

配体亲和力的重要方法,现有的技术方案主要分为:经典的打分函数和机器学习打分函数,如图1所示。
[0003]经典的打分函数基于知识经验,通过制定规则来定量衡量蛋白质

配体相互作用力。按照其打分规则侧重点不同分为:基于力场的打分函数(例如:AutoDock)、基于知识的打分函数(例如:DrugScore)、基于经验的打分函数(例如:X

Score)三大类。机器学习打分函数则通过机器学习方法对蛋白质

配体相互作用力进行评估,从机器学习模型构建方法的角度,可细分为:基于随机森林树的方法、基于深度学习的方法、基于图神经网络的方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于图注意力网络的蛋白质

配体亲和力评价方法,其特征在于,具体方法如下:1)数据增强1.1)基于分子柔性的数据增强方法;1.1.1)提取PDBbind数据集中的配体结构文件;1.1.2)确定分子结构中的可旋转键;1.1.3)根据配体分子可旋转键的转动情况,生成该配体分子的多个不同构象;1.1.4)计算以上分子构象的分子能量,筛选出能量最低的13个构象结构,将数据规模扩大13倍;能量越低的分子构象越稳定;1.2)多尺度数据分割分别采用随机拆分、按精度拆分、分子骨架拆分、时间拆分、分层拆分、蛋白质家族拆分对PDBbind数据集进行拆分;2)基于注意力机制的分子图嵌入方法2.1)确定分子水平的注意力机制添加范围,在化学键水平和原子水平添加注意力机制;2.2)根据蛋白质

配体结合亲和力影响因素,找到与之匹配的分子结构、功能基团;2.3)使用图神经网络进行分子特征提取,分别面向蛋白质和配体对相应的分子结构、功能基团添加注意力机制;2.4)基于注意力机制的分子图嵌入方法设计;该方法包含图卷积层算法和GraphPooling Layer with Attention Mechanism两部分:2.4.1)图卷积层算法2.4.1)图卷积层算法是分子图的邻接矩阵,是的对角矩阵,h
(l)
∈R
N
×
F
是第l个节点的特征矩阵,Θ∈R
F
×1,是所有节点共享的可训练的权重,σ是ReLU激活函数;2.4.2)Graph Pooling Layer with Attention Mechanism蛋白质

配体亲和力评价函数定义为:Z是“蛋白质

配体亲和力评价”的打分;N(v)是节点所有邻域的集合,h
v
表示节点v的特征;h
u
表示节点u的特征;α
T
是共享的注意力操作;α
v,v
是节点v特征的注意力系数,α
u,v
是特征在节点u和节点v间传播时的注意力系数;3.模型设计3.1)模型的输入包括蛋白质口袋结构、配体结构和亲和力数据;3.2)通过配体特征提取算法和蛋白质特征提取算法分别提取配体特征和蛋白质特征;具体的,配体小分子和蛋白质分别采用LigandEmbedding方法和ProteinEmbedding方法提取Ligand Structure representation和Protein Structue representation;
3.3)将蛋白质特征和配体小分子特征融合,得到Combined representation特征;3.4)Combined representation特征经过2个全连接层得到结果y;基于图注意力网络的蛋白质

配体亲和力评价模型的超参数包括Epoch、Batch size、Optimizer、Leaning rate、Dropout rate、Number of...

【专利技术属性】
技术研发人员:杨帅赵志刚王春晓潘景山武鲁魏志强刘昊
申请(专利权)人:中国海洋大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1