一种群体感应先导化合物的虚拟筛选方法及应用技术

技术编号:37714009 阅读:10 留言:0更新日期:2023-06-02 00:08
本发明专利技术公开了一种群体感应先导化合物的虚拟筛选方法,主要流程包括:输入的分子化合物结构通过预处理构建分子邻接矩阵,送入GNN1网络生成化合物特征;输入的蛋白质序列,提取其蛋白质氨基酸组成、二肽频率组合成蛋白质初步特征向量,送入交叉网络,生成交叉融合特征;同时,将蛋白质序列生成对应的接触图,随后送入GNN2网络生成蛋白序列特征;最终将三个特征组合送入全连接层预测得到亲和力值。本发明专利技术可用于发现新的具有群体感应活性的化合物,为青枯菌等细菌的控制和防治提供新的思路和手段;同时该方法可以高效地筛选出与PhcA和PhcR蛋白结合的化合物,从而发现具有群体感应活性的化合物。化合物。化合物。

【技术实现步骤摘要】
一种群体感应先导化合物的虚拟筛选方法及应用


[0001]本专利技术涉及药物化学领域,具体涉及一种青枯菌群体感应先导化合物的靶向虚拟筛选方法及应用。

技术介绍

[0002]青枯雷氏菌(Ralstoniasolanacearum)是世界上最具破坏性的土传病原菌之一,该病原菌广泛分布于全球的热带、亚热带和温带气候地区,并逐渐向高维度高海拔地区扩散蔓延。土传青枯菌入侵作物根际过程中相关的毒力行为受群体感应调控。青枯菌拥有两套群体感应系统:AHL系统和三羟基棕榈酸甲酯(3

OH PAME)系统,其中AHL系统不影响毒力。青枯菌通过3

OH PAME群体感应系统对代谢和毒力行为进行全局性调控,协调各类分泌系统组装,指挥各种毒性因子时序性表达和分泌,从而顺利完成根际入侵过程。该系统由PhcBSR合成组分和调控因子PhcA构成。其中,PhcB负责合成信号分子3

OH PAME,PhcS负责接收感知信号分子,当3

OH PAME的浓度超过一定阈值,PhcS便激活PhcR,进而解除PhcR对PhcA的抑制。PhcA不仅调控青枯菌的初级代谢和AHL群体感应系统,还调控青枯菌的运动性、铁载体、生物膜、细胞壁降解酶、破坏植物免疫系统的III型毒力因子和胞外多糖等与根际入侵过程密切相关的毒力行为。有研究尝试通过降解群体感应分子阻断土传青枯菌的根际入侵过程,但阻控效果并不理想。
[0003]目前,虚拟筛选是计算机辅助药物设计中一种非常常见的策略,已得到广泛应用。药物靶向亲和性(DTA)预测是虚拟筛选的一个重要步骤,它可以快速匹配靶向和药物,加快药物开发过程。DTA预测提供了药物与靶蛋白结合强度的信息,可用于显示小分子是否与蛋白结合。对于具有已知结构和位点信息的蛋白质,我们可以使用分子模拟和分子对接进行详细模拟,从而获得更准确的结果,这被称为基于结构的虚拟筛选。然而,仍有许多蛋白质没有结构信息。即使使用同源模型,仍然很难获得许多蛋白质的结构信息。因此,利用序列(基于序列的虚拟筛选)预测蛋白质与药物分子的结合亲和力是一个迫切的问题,这也是本专利技术的重点。
[0004]基于分子对接的虚拟筛选已成为计算机辅助化合物设计的核心技术,广泛应用于新化合物的靶向研制过程。因此,采用虚拟筛选青枯菌群体感应先导化合物来干扰群体感应可能是控制土传青枯病的重要途径之一。

技术实现思路

[0005]本专利技术的目的在于提供一种青枯菌群体感应先导化合物的靶向虚拟筛选方法,该方法能够基于强化学习自动搜索最佳的图结构,提高图网络的群体感应先导化合物的虚拟筛选模型的性能,且其是基于PhcA和PhcR蛋白结构的群体感应先导化合物的筛选方法,可用于发现新的具有群体感应活性的化合物,为青枯菌等细菌的控制和防治提供新的思路和手段。
[0006]本专利技术采取的技术方案如下:
[0007]一种群体感应先导化合物的虚拟筛选方法,其将分子化合物结构、蛋白质序列作为输入送入预处理模块提取初步特征,再将其送入预测模型网络,其中预测模型的结构及参数通过LSTM控制器训练生成;具体流程如下:
[0008]输入的分子化合物结构通过预处理构建分子邻接矩阵,送入GNN1网络生成化合物特征;
[0009]输入的蛋白质序列,提取其蛋白质氨基酸组成、二肽频率组合成蛋白质初步特征向量,送入交叉网络,生成交叉融合特征;同时,将蛋白质序列生成对应的接触图,随后送入GNN2网络生成蛋白序列特征;
[0010]最终将三个特征组合送入全连接层预测得到亲和力值。
[0011]进一步的,设构建得到的分子邻接矩阵为X1,分子结构图上相邻的原子矩阵元素值为1,不相邻为0,分子邻接矩阵大小为(n*n),n是结构图中节点的数量,即所有原子的数量。
[0012]进一步的,使用Pconsc4软件处理蛋白序列,输出残差对是否接触的概率矩阵,大小为m*m,保留矩阵中大于0.5的值,其他值置为0,过滤后的矩阵为蛋白质接触图X2,其中m是残差的数量。
[0013]进一步的,氨基酸组成是构成序列的20种氨基酸各自出现的频率,二肽的频率是任意两个氨基酸构成的氨基酸对出现的频率。
[0014]进一步的,所述预测模型网络由GNN1网络、GNN2网络、交叉网络并联组成,合并后送入一个拼接层和DROPOUT层,再接上两个全连接层。
[0015]进一步的,所述交叉网络由5个交叉层串联组成,最后接一个128维全连接层,全连接层输出为f3,每个交叉层具有以下公式:
[0016]C
l+1
=X0C
Tl
W
c,l
+b
c,l
+C
l
[0017]其中:l=1,2,

,5,C
l
和C
l+1
分别是第l层和第l+1层cross layer的输出,C0即氨基酸组成、二肽频率的组合X3,W
c,l
和b
c,l
是这两层之间的连接参数;上式中所有的变量均是列向量。每一层的输出,都是上一层的输出加上特征交叉。
[0018]进一步的,所述分子邻接矩阵、蛋白质接触图被分别输入到两个不同的GNN1和GNN2网络,每个网络由3个GNN层组成,两个GNN网络的输出特征为f1、f2,再加上交叉融合特征,拼接后为f1+f2+f3,得到用于预测的相应小分子

蛋白质对的总体特征;随后送入一个全连接层,输出维度为128,接着送入第二个全连接层,输出维度为1,即网络预测的亲和力值。
[0019]进一步的,通过LSTM控制器实现虚拟筛选网络模型优化,模型优化就是在确定的参数空间使用强化学习得到两个GNN最佳结构参数以及整个网络中其它神经元的参数;GNN结构M需要要确定几个参数:采样功能(S)、相关度量函数(Att)、聚合功能(Agg)、多头注意力数量(K)、输出隐藏嵌入(Dim)和激活函数(Act)。
[0020]更进一步的,优化由两步组成,首先LSTM预测一个GNN1的S、Att、Agg、Act、K、Dim对应操作,每个预测都由LSTM的softmax分类器执行,接着将该预测值输入到下一个时间点,得到下一个参数预测;当达到GNN Layer的层数3时,LSTM控制器完成一次架构的生成;重复该过程生成GNN2的参数;构建并训练整个预测网络,得到GNN网络及其它网络层权重参数;然后基于网络训练后得到的准确率用强化学习优化LSTM的参数,以得到优化控制器模型;两个步骤交替执行一定步数结束得到最终筛选网络模型。
[0021]上述方法可在青枯菌群体感应先导化合物的虚拟筛选中应用。
[0022]本专利技术的有益效果是:首先,本方法提取分子邻接矩阵、蛋白质接触图、蛋白序列交叉融合特征形成多维度特征,能更好体现分子与蛋白特征;其次,本方法使用强化学习优化模型结构,避免了以往靠经验或大量人工选取模型参数。本方法的完善和推广能够有效地进行先本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种群体感应先导化合物的虚拟筛选方法,其特征在于,将分子化合物结构、蛋白质序列作为输入送入预处理模块提取初步特征,再将其送入预测模型网络,其中预测模型的结构及参数通过LSTM控制器训练生成;具体流程如下:输入的分子化合物结构通过预处理构建分子邻接矩阵,送入GNN1网络生成化合物特征;输入的蛋白质序列,提取其蛋白质氨基酸组成、二肽频率组合成蛋白质初步特征向量,送入交叉网络,生成交叉融合特征;同时,将蛋白质序列生成对应的接触图,随后送入GNN2网络生成蛋白序列特征;最终将三个特征组合送入全连接层预测得到亲和力值。2.根据权利要求1所述的一种群体感应先导化合物的虚拟筛选方法,其特征在于,设构建得到的分子邻接矩阵为X1,分子结构图上相邻的原子矩阵元素值为1,不相邻为0,分子邻接矩阵大小为(n*n),n是结构图中节点的数量,即所有原子的数量。3.根据权利要求1所述的一种群体感应先导化合物的虚拟筛选方法,其特征在于,使用Pconsc4软件处理蛋白序列,输出残差对是否接触的概率矩阵,大小为m*m,保留矩阵中大于0.5的值,其他值置为0,过滤后的矩阵为蛋白质接触图X2,其中m是残差的数量。4.根据权利要求1所述的一种群体感应先导化合物的虚拟筛选方法,其特征在于,氨基酸组成是构成序列的20种氨基酸各自出现的频率,二肽的频率是任意两个氨基酸构成的氨基酸对出现的频率。5.根据权利要求1所述的一种群体感应先导化合物的虚拟筛选方法,其特征在于,所述预测模型网络由GNN1网络、GNN2网络、交叉网络并联组成,合并后送入一个拼接层和DROPOUT层,再接上两个全连接层。6.根据权利要求1所述的一种群体感应先导化合物的虚拟筛选方法,其特征在于,所述交叉网络由5个交叉层串联组成,最后接一个128维全连接层,全连接层输出为f3,每个交叉层具有以下公式:C
l+1
=X0C
Tl
W
c,l
+b
c,l
+C
l
其中:l=1,2,

,5,C

【专利技术属性】
技术研发人员:江高飞薛卫张家璇刘佐韦中徐阳春沈其荣
申请(专利权)人:南京农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1