当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于对抗攻击的药物分子重要节点预测方法技术

技术编号:37711372 阅读:5 留言:0更新日期:2023-06-02 00:04
本发明专利技术公开了一种在抽象图拓扑结构中结合对抗性攻击分析图网络,从而能够预测药物分子的重要节点的模型构建方法,属于图神经网络和药物分子设计技术领域。该方法通过PCNC方法对分子表征向量进行特征变换,将分子表征向量与杂讯表征输入共享参数的图神经网络得到输出结果,以输出结果波动程度衡量函数VMF作为损失函数,结合对抗性攻击分析特定节点对抗杂讯表征的鲁棒性。该方法通过理论设计和实验验证,根据相关参数建立杂讯表征以输入目标模型,在对输出结果进行波动分析之后输出关键药物分子官能团预测结果,根据关键官能团分析药物分子属性,在药物分子设计的模型解释方面具有创新意义。有创新意义。有创新意义。

【技术实现步骤摘要】
Constructs Noise Characterization,基于扰动构造杂讯表征)对分子表征向量进行特征变换,输入与步骤1中所述检验神经网络中得到对应输出结果;
[0011]步骤3:将步骤1和步骤2分别得到的结果输入波动程度衡量函数VMF(Volatility Measurement Function),得到以波动程度为损失函数的节点重要度;
[0012]步骤4:重复步骤2至3,直至目标函数接近收敛,得到药物分子重要节点即官能团;
[0013]步骤5:在药物分子官能团获得后进行分子性质翻译,从而得到预测的药物分子性质。
[0014]其中,步骤1中,分子图模型建模利用rdkit包将给定的SMILES药物分子序列转化为以原子团结构为节点的DGL图,根据生成的DGL图构建邻接矩阵,具体如下:
[0015]步骤101:将SMILES格式的药物分子转化为RDKIT的mol对象,通过提取原子特征和化学键特征生成以原子结构为节点的DGL图,再利用基于化学反应模板的BRICS方法对分子片段库进行构建,划分分子官能团,重新生成以原子团结构为节点的DGL图,
[0016]步骤102:在药物分子图模型建模中,将药物分子据转换为图数据,所述图数据包括多个节点和多个边,所述节点表征构成所述待测药物分子的官能团,所述边表征所述连接待预测药物分子官能团的化学键,其中连接不同官能团的化学键的权值不同,
[0017]步骤103:步骤1中所述检验神经网络为事先训练好的检验药物分子功能的模型,固定其参数,将给定的药物分子输入检验神经网络,得到输出结果。
[0018]其中,步骤2中,根据Adversarial Attack(对抗攻击)的思想,对药物分子重要节点进行表征掩码学习,从而对给定的药物分子向量进行特征变换。其中,掩码是一个与分子表征向量同维数的零一矩阵,更新掩码是一个迭代的过程。
[0019]步骤201:第一次迭代时掩码的构建方法(初始化)具体如下:
[0020]步骤20101:确定重构粒度作为模型超参数之一,重构粒度即掩码中0元素的个数;
[0021]步骤20202:根据步骤201选取的重构粒度随机初始化一个掩码矩阵,将其与原来的药物分子表征向量逐元素相乘,得到药物分子杂讯表征;
[0022]步骤20103:将得到的药物分子杂讯表征输入步骤1的检验神经网络中得到输出结果;步骤202:后续迭代时掩码的构建方法具体如下:
[0023]步骤20201:借助贪心算法对更新上一个掩码矩阵,使得掩码沿使步骤3中的VMF增大的方向更新;
[0024]步骤20202:将更新后的掩码矩阵与原来的药物分子表征向量逐元素相乘,得到更新后的药物分子杂讯表征;
[0025]步骤20203:将更新后的药物分子杂讯表征输入步骤1的检验神经网络中得到输出结果;其中,步骤3中,VMF函数根据所选检验神经网络任务分为回归任务与分类任务,具体构建方法如下:
[0026]步骤301:当所选任务为回归任务时,利用欧几里得距离(Eucliden Distance)计算步骤1和步骤2得到的结果的差异。
[0027][0028]其中A表示步骤1中的输出结果矩阵,B表示步骤2中的输出结果矩阵,d(A,B)表示
两个矩阵之间的欧几里得距离,A
i
表示矩阵A中的第i个元素,B
i
同理;
[0029]步骤302:当所选任务为分类任务时,由于分类任务通常选用交叉熵损失作为优化目标,故使用图神经网络输出的分类概率信息作为波动程度值。
[0030]VMF(A,B)=|p(Y=A)

p(Y'=A)|
[0031]其中A表示步骤1中得到的分类结果,B表示步骤2中得到的分类结果,p(Y=C)表示特征向量输入检验神经网络后分类结果Y概率为A的概率,p(Y

=C)表示步骤2所构造的杂讯表征输入检验神经网络后分类结果Y的概率仍为A的概率,两个概率取差的绝对值得到VMF函数的输出。
[0032]其中,步骤5中,根据关键官能团预测药物分子属性,具体如下:
[0033]步骤501:利用已知的官能团与药物分子性质对应关系制作官能团

药物分子性质对照词典,步骤502:通过S1得到的药物分子关键官能团作为查询条件,得到给定的官能团对应的分子性质预测,
[0034]步骤503:利用预测的官能团关键程度作为对应分子性质预测概率,得到该药物分子的性质预测及其对应概率。
[0035]本专利技术提供的方法,还具有以下特征:
[0036]其中,分子图模型建模利用rdkit包将给定的SMILES药物分子序列转化为以原子团结构为节点的DGL图,根据生成的DGL图构建邻接矩阵。
[0037]其中,进一步地,将SMILES格式的药物分子转化为RDKIT的mol对象,通过提取原子特征和化学键特征生成以原子结构为节点的DGL图,再利用基于化学反应模板的BRICS方法对分子片段库进行构建,划分分子官能团,重新生成以原子团结构为节点的DGL图。
[0038]其中,PCNC方法根据加权扰动函数WPF对原始分子表征向量进行特征变换。
[0039]本专利技术提供的方法,还具有以下特征:
[0040]其中,分子性质翻译需要事先创建官能团

性质词典,在得到官能团后对依照词典对分子性质进行翻译,得到预测的分子性质。
[0041]与现有技术相比,本专利技术的技术方案具有以下有益技术效果:
[0042]对神经网络黑盒模型生成的药物分子进行可解释性分析是药物分子设计的任务之一,本专利技术采用的是基于对抗攻击预测药物分子的重要官能团,使用图结构表示的药物分子,充分考虑了分子中每一个原子的相互作用,表示药物分子的复杂关系,减少了信息缺失。将药物分子原始表征向量通过PCNC方法构造杂讯表征,根据对抗攻击思想分别输入给定的检验神经网络中,使得可以通过输出结果波动程度得到量化的节点的重要程度,从而进一步地,根据重要节点即官能团对药物分子的性质进行解释,相比于传统的物理化学方法,效率更高。本方法并不局限于小分子药物分子,对于神经网络生成的大分子药物分子依然可以使用本方法进行解释。同时,使用本方法能够为药物分子的解释进行进一步的可视化表达,有助于理解模型的决策过程。总之,使用本专利技术所提供的一种基于对抗攻击的药物分子重要节点预测方法可以充分考虑药物原子分子结构,高效解释药物分子性质,能够扩展到大分子药物分子,以及有助于提高模型可解释性,为新型药物的设计和研发实现AI赋能。
附图说明
[0043]图1是本专利技术的实例中根据药物分子结构预测关键官能团的总流程图;
[0044]图2是本专利技术的实例中根据药物分子结构绘制的官能团节点结构信息图。
具体实施方式
[0045]为使本申请的目的、技术方案及优点更加清晰,以下由结合附图及实施例,对本申请进行进一步详细说明。应当理解,此本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于对抗攻击的药物分子重要节点预测方法,其特征在于,该方法包括的步骤有:步骤1:对输入的药物分子进行图模型建模,编码得到对应的分子表征向量,输入检验神经网络模型中得到预处理结果;步骤2:对得到的药物分子表征向量进行特征变换,根据PCNC方法(Perturbation Constructs Noise Characterization,基于扰动构造杂讯表征)对分子表征向量进行特征变换,输入与步骤1中所述检验神经网络中得到对应输出结果;步骤3:将步骤1和步骤2分别得到的结果输入波动程度衡量函数VMF(VolatilityMeasurement Function),得到以波动程度为损失函数的节点重要度;步骤4:重复步骤2至3,以进行目标函数的迭代,直至目标函数接近收敛,得到药物分子重要节点即官能团;步骤5:在药物分子官能团获得后进行分子性质翻译,从而得到预测的药物分子性质。2.根据权利要求1所述的一种基于对抗攻击的药物分子重要节点预测方法,其特征在于,步骤1中,分子图模型建模利用rdkit包将给定的SMILES药物分子序列转化为以原子团结构为节点的DGL图,根据生成的DGL图构建邻接矩阵,具体如下:步骤101:将SMILES格式的药物分子转化为RDKIT的mol对象,通过提取原子特征和化学键特征生成以原子结构为节点的DGL图,再利用基于化学反应模板的BRICS方法对分子片段库进行构建,划分分子官能团,重新生成以原子团结构为节点的DGL图,步骤102:在药物分子图模型建模中,将药物分子据转换为图数据,所述图数据包括多个节点和多个边,所述节点表征构成所述待测药物分子的官能团,所述边表征所述连接待预测药物分子官能团的化学键,其中连接不同官能团的化学键的权值不同,步骤103:步骤1中所述检验神经网络为事先训练好的检验药物分子功能的模型,固定其参数,将给定的药物分子输入检验神经网络,得到输出结果。3.根据权利要求1所述的一种基于对抗攻击的药物分子重要节点预测方法,其特征在于,步骤2中,根据Adversarial Attack(对抗攻击)的思想,对药物分子重要节点进行表征掩码学习,从而对给定的药物分子向量进行特征变换,其中,掩码是一个与分子表征向量同维数的零一矩阵,更新掩码是一个迭代的过程;步骤201:第一次迭代时掩码的构建方法(初始化)具体如下:步骤20101:确定重构粒度作为模型超参数之一,重...

【专利技术属性】
技术研发人员:詹滢王贝伦马浩轩胡丹婷
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1