一种基于图注意力网络的芳香硝基化合物毒性预测方法技术

技术编号：39767056 阅读：7 留言：0更新日期：2023-12-22 02:20

本发明专利技术提供一种基于图注意力网络的芳香硝基化合物毒性预测方法，包括：步骤1：数据预处理，收集芳香硝基化合物及其毒性数据作为模型数据集，并把化合物分子式转化为图数据，再采用增加自身环回和节点洗牌法进行数据增强；步骤2：建立图卷积神经网络模型，由图卷积边注意力

全部详细技术资料下载

【技术实现步骤摘要】
一种基于图注意力网络的芳香硝基化合物毒性预测方法

[0001]本专利技术涉及化合物毒性预测
，特别是一种基于图注意力网络的芳香硝基化合物毒性预测方法
。

技术介绍

[0002]芳香硝基化合物，由于制备容易
、
价格较低和稳定性好，广泛应用于染料
、
炸药
、
农药
、
香料
、
医药
、
塑料
、
涂料等化学工业生产中，是最大的化工原料
。
芳香族硝基化合物属中等毒到低毒类，具有免疫毒性
、
皮肤致敏性
、
生殖细胞变性
、
致突变性和致癌性，在工业生产和使用中，主要以废水
、
粉尘和蒸气等形式污染环境，影响人体健康
。
本类物质大多能氧化血红蛋白为高铁血红蛋白，使它失去携氧功能，严重时能引起中枢神经系统兴奋症状及其它神经系统症状，如头部沉重
、
头胀
、
头晕
、
头痛
、
耳鸣
、
手指麻木
、
全身乏力等等
。
因此，为防止芳香族硝基化合物对环境的污染和人体的危害，应该在化合物研发或应用的早期进行其毒性评价
。
因此，如何及时
、
快速
、
准确预测芳香族硝基化合物分子毒性具有重要价值
。
[0003]随着计算机技术和化...

【技术保护点】

【技术特征摘要】
1.
一种基于图注意力网络的芳香硝基化合物毒性预测方法，其特征在于，包括以下步骤：步骤1：数据预处理，收集芳香硝基化合物及其毒性数据作为模型数据集，并把化合物分子式转化为图数据，再采用增加自身环回和节点洗牌法进行数据增强；步骤2：建立图卷积神经网络模型，由图卷积边注意力
、
图卷积
、
节点信息汇聚三个模块组成；步骤3：实验设置，包括优化器选择
、
损失函数设计以及学习率设置及其下降策略选择；步骤4：模型评估，采用8种模型评价指标来验证模型的有效性
。2.
根据权利要求1所述的一种基于图注意力网络的芳香硝基化合物毒性预测方法，其特征在于，所述步骤1中数据为
SMILES
分子式；
SMILES
分子式通过在化学分子图的深度优先遍历中遇到的符号节点而获得相应的字符串，将分子表示为无信息丢失的完整的分子图结构；在输入图卷积神经网络
GCN
时，要将
SMILES
分子式转化为图数据，步骤如下：步骤
S1
：利用深度图学习框架
DGL
和化学信息学工具
RDKit
，把待测化合物
SMILES
字符串转化为对应的图数据；一个分子用一个无向图
G(v,e)
来表示，其中分子中的原子对应节点
v
，化学键对应边
e
；提取原子特征包括元素种类
、
隐含价
、
价电子
、
成键
、
电荷
、
杂化类型
26
维信息，边特征包括单键
、
双键
、
三键
、
成环
、
芳香环
、
共轭6维信息；如一个
SMILES
分子式
:CN1C(
＝
O)C2
＝
C(C
＝
C(C
＝
C2)[N+]([O
‑
])
＝
O)C1
＝
O
，经转化获得一张图，其节点数为
15
，边数为
32
，每个节点的特征为
26
维向量，每条边的特征为6维向量，即把每一个分子转为为固定形状的图结构；步骤
S2
：采用增加自身环回和节点洗牌法进行数据增强；自身环回指的是给每个节点加上自己和自己的环回，让网络能找到和自身的关系；节点洗牌指的是把一个图的节点打乱，但边的位置保持不变
。3.
根据权利要求1所述的一种基于图注意力网络的芳香硝基化合物毒性预测方法，其特征在于，步骤2中，图卷积神经网络由图卷积边注意力
、
图卷积
、
节点信息汇聚三个模块组成；设图中节点
v
i
在第...

【专利技术属性】
技术研发人员：陈梅妹，李灿东，杨朝阳，王洋，
申请(专利权)人：福建中医药大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人