【技术实现步骤摘要】
一种基于评分器和动态图网络的分子对接方法
[0001]本专利技术涉及分子对接
,更具体的说是涉及一种基于评分器和动态图网络的分子对接方法。
技术介绍
[0002]目前,已有的机器学习多集中于预测式模型的研究上,对生成式模型的研究相对不足。在实际问题中,往往需要利用机器学习去生成新的样本。如何能够有效地对数据集数据分布进行建模并生成出可靠的样本,需要对生成式模型有更多的研究。最常用的生成式模型(生成对抗网络和变分自编码器)都有各自的不足。生成对抗网络的度量是靠数据驱动学习而得,类似黑箱系统可解释性不高,且具有训练难度大的特点;变分自编码器只能近似似然函数的下界,不能准确估计似然函数和下界之间的间隙,所以生成的质量欠佳。
[0003]当下主流的分子对接软件应用的是非深度学习方法,应用源自经验的分子力场对分子构象进行亲和力计算,可靠性不高;应用蒙特卡罗方法对分子构象进行搜索,对计算机算力要求较高,搜索速度较慢。当对大量分子数据集进行虚拟筛选时,速度成为了此方法的最大限制。
[0004]目前的蛋白质和小分子表征 ...
【技术保护点】
【技术特征摘要】
1.一种基于评分器和动态图网络的分子对接方法,其特征在于,包括以下步骤:S1、构建预测器的图神经网络,即定义节点特征及边特征;S2、对上述构建的预测器的图神经网络进行更新;S3、基于预测器对亲和力进行预测;S4、构建及训练预测器的损失函数;S5、构建生成器,对数似然函数进行定义;S6、基于生成器对数似然函数的梯度进行预测;S7、对生成器进行训练,基于朗之万采用进行构象优化;S8、基于预测器及生成器,完成分子对接。2.根据权利要求1所述的一种基于评分器和动态图网络的分子对接方法,其特征在于,所述步骤S1具体包括:S11、对配体原子和口袋原子的特征进行编码,编码形式为:v
i
=(a
i
,c
i
,h
i
)其中,i为原子对应的序号,a
i
为原子在元素周期表中对应的序号,c
i
表征次原子是否属于配体原子,若是,则c
i
=1,若否,则c
i
=0,h
i
表征远在是否为氢键供体,若是,则h
i
=1,若否,则h
i
=0;S12、判断两原子之间距离是否小于若是,则将二者用边连接,表示其间存在相互作用,对上述定义的边特征进行编码,编码形式为:e
ij
=(b
ij
,d
ij
)其中,i,j为此边连接的两个原子,b
ij
为边的类型,大π键、单键、双键、三键、认为连接的情况分别对应b
ij
=0,1,2,3,d
ij
=||x
i
‑
x
j
||为边的长度,x
i
,x
j
为两原子对应的三维坐标,由此得到图结构其中代表上述每一个节点v
i
的集合;ε代表上述每一条边e
ij
的集合。3.根据权利要求1所述的一种基于评分器和动态图网络的分子对接方法,其特征在于,所述步骤S2具体包括:S21、基于步骤S1、对预测器的图神经网络进行更新,更新公式为:其中,j为与节点i相邻的节点的序号,为上一次更新的节点的隐藏状态,e
ij
为边的特征,FNN(
·
)为两层全连接网络;S22、上述图神经网络的更新,得到每一个节点的最终隐藏状态,将完整的更新过程记为:其中,N为所有的节点数,为原子的隐藏状态,为图结构,MPN(
·
)为图神经网络的更新方式。4.根据权利要求1所述的一种基于评分器和动态图网络的分子对接方法,其特征在于,所述步骤S3具体包括:
S31、对所有的原子状态取平均,得到整张图的隐藏状态:S32、基于图隐藏状态h,将其通过三个全连接层得到预测的亲和力K
pred
:K
pred
=FFN(h)。5.根据权利要求1所述的一种基于评分器和动态图网络的分子对接方法,其特征在于,所述步骤S4具体包括:选取数据集,获取对接构象及对应的亲和力分数,即解离常数K
d
,将预测的亲和力与真实的亲和力分数的方差作为损失函数loss:loss=(K
d
‑
K
pred
)2基于梯度下降的方法调整模型参数,使得损失值最小,完成预测器的训练。6.根据权利要求1所述的一种基于评分器和动态图网络的分子对接方法,其特征在于,所述步骤S5具体包括:将对数似然...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。