一种判断图神经网络模型中子结构活性的方法及系统技术方案

技术编号:39053113 阅读:14 留言:0更新日期:2023-10-12 19:45
本发明专利技术公开了一种判断图神经网络模型中子结构活性的方法及系统,该方法首先在图神经网络模型中匹配含有第一子结构的所有化合物的集合,提取在所述化合物中含有该第一子结构的第二子结构集合,然后利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值;计算第一子结构对于每个化合物的活性的贡献值;最后将所有贡献值的均值与阈值比较,判断所述第一子结构在所述图神经网络模型中是否为活性子结构;本发明专利技术在图神经网络模型中进一步探究结构

【技术实现步骤摘要】
一种判断图神经网络模型中子结构活性的方法及系统


[0001]本专利技术涉及一种判断子结构活性的方法及系统,尤其是判断图神经网络模型中子结构活性的方法及系统。

技术介绍

[0002]近年来,图神经网络模型能够有效地学习图数据中节点之间的复杂关系,已经被广泛应用于计算毒理学领域预测毒性化合物。然而,尽管图神经网络模型在准确度方面表现出色,但理解图神经网络模型模型的决策过程以及其对输入的解释仍然是一个具有挑战性的问题。这限制了图神经网络模型在一些关键应用中的可解释性和可靠性。
[0003]目前已经提出了许多可解释的人工智能方法来解决图神经网络模型中普遍缺乏可解释性的问题,然而,基于化合物构建的图神经网络模型的大多数现有解释方法都侧重于将模型预测归因于单个节点,边缘或片段,这些节点,边缘或片段不一定来自具有化学意义的分子分割。这种可解释性充其量只能部分地与化学家的直觉相容,化学家更习惯于从化学上有意义的子结构(例如官能团)而不是单个原子或键来理解分子结构和性质之间的因果关系。现有技术中无法实现对图神经网络模型中的子结构进行解释。

技术实现思路

[0004]专利技术目的:本专利技术的目的是提供一种能够解释神经网络模型中化合物子结构活性的方法及系统。
[0005]技术方案:本专利技术所述的判断图神经网络模型中子结构活性的方法,判断待计算子结构在图神经网络模型中是否为活性子结构,其中所述待计算子结构为第一子结构;该方法包括如下步骤:
[0006]步骤1,在图神经网络模型中匹配含有第一子结构的所有化合物的集合;
[0007]步骤2,提取在所述化合物中含有该第一子结构的第二子结构集合;所述图神经网络模型用于预测化合物的活性或毒性预测值;
[0008]步骤3,利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值;
[0009]步骤4,计算第一子结构对于该化合物的活性的贡献值;
[0010]步骤5,重复步骤2至步骤4得到第一子结构对于每个化合物的活性的贡献值,计算所有所述贡献值的均值,将该均值与阈值比较,判断所述第一子结构在所述图神经网络模型中是否为活性子结构。
[0011]进一步地,步骤4所述计算第一子结构对于该化合物的活性的贡献值包括:
[0012]计算每个第二子结构的活性或毒性预测值与第二子结构掩蔽第一子结构的活性或毒性预测值的差值,计算所述差值的平均值,得到第一子结构对于该化合物的活性的贡献值。
[0013]进一步地,步骤5所述计算所有所述贡献值的均值,将该均值与阈值比较,判断所
述第一子结构在所述图神经网络模型中是否为活性子结构包括:
[0014]计算所有所述贡献值的均值,若所述均值大于0,则所述第一子结构在所述图神经网络模型中是活性子结构;否则所述第一子结构在所述图神经网络模型中不是活性子结构。
[0015]进一步地,步骤3所述利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值包括:
[0016]在所述图神经网络中提取每个第二子结构的表征,输入到所述图神经网络中得到第二字结构的活性或毒性预测值;
[0017]在所述图神经网络中提取每个第二子结构掩蔽第一子结构的表征,输入到所述图神经网络中得到第二字结构掩蔽第一子结构的活性或毒性预测值。
[0018]进一步地,所述在所述图神经网络中提取每个第二子结构的表征包括:在所述图神经网络模型对化合物的原子表征中,将不属于该第二子结构的原子特征值变为0。
[0019]进一步地,在所述图神经网络中提取每个第二子结构掩蔽第一子结构的表征,在所述图神经网络模型对化合物的原子表征中,将不属于该第二子结构的原子特征值变为0,并将该第一子结构的原子特征值变为0。
[0020]本专利技术所述判断图神经网络模型中子结构活性的系统,所述系统用于判断待计算子结构在图神经网络模型中是否为活性子结构,其中所述待计算子结构为第一子结构;包括:
[0021]化合物匹配单元,用于在图神经网络模型中匹配含有第一子结构的所有化合物的集合;
[0022]第二子结构提取单元,用于提取在所述化合物中含有该第一子结构的第二子结构集合;所述图神经网络模型用于预测化合物的活性或毒性预测值;
[0023]预测值获取单元,用于利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值;
[0024]贡献值计算单元,用于计算第一子结构对于每个化合物的活性的贡献值,以及用于计算第一子结构对于所有化合物的活性的贡献值的均值;
[0025]活性子结构判断单元,用于将第一子结构对于所有化合物的活性的贡献值的均值与阈值比较,判断所述第一子结构在所述图神经网络模型中是否为活性子结构。
[0026]进一步地,贡献值计算单元中,所述计算第一子结构对于每个化合物的活性的贡献值包括:计算每个第二子结构的活性或毒性预测值与第二子结构掩蔽第一子结构的活性或毒性预测值的差值,计算所述差值的平均值,得到第一子结构对于该化合物的活性的贡献值。
[0027]本专利技术所述的电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述计算机程序被加载至处理器时实现所述的判断图神经网络模型中子结构活性的方法。
[0028]本专利技术所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现所述的判断图神经网络模型中子结构活性的方法。
[0029]有益效果:与现有技术相比,本专利技术的优点在于:(1)本专利技术将图神经网络模型的预测归因于化合物子结构来解释图神经网络模型预测,提供有效的化合物结构

活性关系
的信息,为相关人员对化合物构效关系的探究提供新的思路,有助于药物化学家对化合物进行结构优化和从头设计;(2)本专利技术通过提出一级子结构和二级子结构以及扰动特征的计算过程,将SHAP值法有效融合在图神经网络模型中计算活性子结构,使模型结果可解释,且计算结果准确可信。
附图说明
[0030]图1为本专利技术的判断图神经网络模型中子结构活性的方法流程图。
[0031]图2为本实施例中的一级子结构、化合物集合、二级子结构示意图。
具体实施方式
[0032]下面结合附图对本专利技术的技术方案作进一步说明。
[0033]如图1所示,所述判断图神经网络模型中子结构活性的方法,包括如下步骤:
[0034]S1:构建用于预测化合物活性的图神经网络模型,模型输入为化合物SMILES式,模型预测基本过程为在模型内部将化合物转化为分子图的表征,进而通过神经网络进行拟合,模型输出结果时先将内部参数映射为两个值,这两个值分别对应模型预测的类别,其中活性类别对应的值为预测值,模型输出结果为两个值中较大的值所对应的类别。
[0035]本实施例中构建的图神经网络模型用于本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种判断图神经网络模型中子结构活性的方法,其特征在于,判断待计算子结构在图神经网络模型中是否为活性子结构,其中所述待计算子结构为第一子结构;该方法包括如下步骤:步骤1,在图神经网络模型中匹配含有第一子结构的所有化合物的集合;步骤2,提取在所述化合物中含有该第一子结构的第二子结构集合;所述图神经网络模型用于预测化合物的活性或毒性预测值;步骤3,利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值;步骤4,计算第一子结构对于该化合物的活性的贡献值;步骤5,重复步骤2至步骤4得到第一子结构对于每个化合物的活性的贡献值,计算所有所述贡献值的均值,将该均值与阈值比较,判断所述第一子结构在所述图神经网络模型中是否为活性子结构。2.根据权利要求1所述的判断图神经网络模型中子结构活性的方法,其特征在于,步骤4所述计算第一子结构对于该化合物的活性的贡献值包括:计算每个第二子结构的活性或毒性预测值与第二子结构掩蔽第一子结构的活性或毒性预测值的差值,计算所述差值的平均值,得到第一子结构对于该化合物的活性的贡献值。3.根据权利要求1所述的判断图神经网络模型中子结构活性的方法,其特征在于,步骤5所述计算所有所述贡献值的均值,将该均值与阈值比较,判断所述第一子结构在所述图神经网络模型中是否为活性子结构包括:计算所有所述贡献值的均值,若所述均值大于0,则所述第一子结构在所述图神经网络模型中是活性子结构;否则所述第一子结构在所述图神经网络模型中不是活性子结构。4.根据权利要求1所述的判断图神经网络模型中子结构活性的方法,其特征在于,步骤3所述利用所述图神经网络模型计算每个第二子结构的活性或毒性预测值,以及每个第二子结构掩蔽第一子结构的活性或毒性预测值包括:在所述图神经网络中提取每个第二子结构的表征,输入到所述图神经网络中得到第二字结构的活性或毒性预测值;在所述图神经网络中提取每个第二子结构掩蔽第一子结构的表征,输入到所述图神经网络中得到第二字结构掩蔽第一子结构的活性或毒性预测值。5.根据权利要求4所述的判断图神经网络模型中子结构活性的方法,其特征在于,所述在所述图神经网络中提取每个第二子结构的表征...

【专利技术属性】
技术研发人员:耿金菊樊帆刘甫钱玉立王瑾丰许柯于清淼任洪强
申请(专利权)人:南京大学宜兴环保研究院重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1