当前位置: 首页 > 专利查询>武汉大学专利>正文

基于深度学习预测模型的药物分子有效性验证方法及系统技术方案

技术编号:39281153 阅读:24 留言:0更新日期:2023-11-07 10:55
本发明专利技术公开了一种基于深度学习预测模型的药物分子有效性验证方法及系统,首先输入需要进行有效性验证的药物分子SMILES表达式;选择需要预测的药物分子属性类别,选择需要进行相互作用验证的药物集合;然后从SMILES表达式中获取药物分子的结构信息,根据原子之间的连接信息生成药物分子中化学键的边集;通过对有效编码进行归一化的操作得到最终需要的原子特征向量,将原子特征向量进行整合,获得药物分子特征矩阵;最后基于自注意力编码器的药物分子属性预测模型和边嵌入的药物相互作用预测模型,通过对药物分子进行属性预测与常见的药物分子进行相互作用预测判断药物分子的有效性。本发明专利技术有助于提高药物的疗效和安全性,改善人们的生活质量。改善人们的生活质量。改善人们的生活质量。

【技术实现步骤摘要】
基于深度学习预测模型的药物分子有效性验证方法及系统


[0001]本专利技术属于计算机科学和药物发现
,具体涉及一种药物分子有效性验证的方法及系统,具体涉及一种基于自注意力编码器的药物分子属性预测模型和基于边嵌入的药物相互作用预测模型的药物分子有效性验证方法及系统。

技术介绍

[0002]针对药物分子属性预测任务和药物相互作用预测任务,许多国内外学者已经展开了深入的研究,并取得了有价值的研究成果。这些研究成果基于机器学习和深度学习等技术,为药物发现领域提供了有效的预测模型,可以准确地预测和评估药物分子的性质和活性,为药物研发工作提供了重要的支持和指导。这些成果不仅在药物研发领域具有广泛的应用和推广价值,也为生物信息学、计算化学等相关领域的发展提供了有力的支持。
[0003]现阶段,药物分子属性预测的方法可以分为两大类,第一类是基于序列进行药物分子属性预测,第二类是基于图神经网络进行药物分子属性预测。SMILES表达式是描述分子的最直接和最简单的方式,它类似于自然语言,SMILES可以被视为序列数据,并且基于序列的药物分子属性预测方法本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习预测模型的药物分子有效性验证方法,其特征在于,包括以下步骤:步骤1:输入需要进行有效性验证的药物分子SMILES表达式;选择需要预测的药物分子属性类别,选择需要进行相互作用验证的药物集合;步骤2:从SMILES表达式中获取药物分子的结构信息,根据原子之间的连接信息生成药物分子中化学键的边集Edge={(x
a
,x
b
),

,(x
i
,x
l
)};其中,x
i
,x
l
分别表示药物分子中两个原子节点;生成长度为d的药物分子中包含原子的一位有效编码,通过对有效编码进行归一化的操作得到最终需要的原子特征向量,将原子特征向量进行整合,获得药物分子特征矩阵其中,为药物分子中每个原子的特征向量,N为药物分子中原子节点的数量;步骤3:基于自注意力编码器的药物分子属性预测模型和边嵌入的药物相互作用预测模型,通过对药物分子进行属性预测与常见的药物分子进行相互作用预测判断药物分子的有效性。2.根据权利要求1所述的基于深度学习预测模型的药物分子有效性验证方法,其特征在于:所述自注意力编码器的药物分子属性预测模型,由多层次图神经网络模块、分子指纹嵌入模块和多模态软融合模块组成;所述多层次图神经网络模块,由顺序连接的图注意力神经网络、池化层与基于自注意力的编码器组成;所述图神经网络用于提取来自药物分子图的特征信息,所述池化层用于从药物分子特征矩阵中获取药物分子特征向量,所述基于自注意力的编码器用于进行更深层次的药物分子特征提取,将输出药物分子的高阶特征嵌入向量;所述分子指纹嵌入模块,用于提取来自药物分子指纹的特征信息,将获取到的分子指纹特征向量进行特征聚合操作后,使用全连接层进行高阶特征提取;所述多模态软融合模块,用于将来自于多层次图神经网络模块与分子指纹嵌入模块的特征信息融合,使用前馈神经网络用于药物分子属性预测任务。3.根据权利要求1所述的基于深度学习预测模型的药物分子有效性验证方法,其特征在于:所述自注意力编码器的药物分子属性预测模型,是训练好的自注意力编码器的药物分子属性预测模型;训练过程包括以下步骤:(1)训练数据集准备;获取若干药物分子数据,从SMILES表达式中获取药物分子的结构信息,根据原子之间的连接信息生成药物分子中化学键的边集Edge={(x
a
,x
b
),

,(x
i
,x
l
)};其中,x
a
,x
b
,x
i
,x
l
分别表示药物分子中两个原子节点;生成长度为d的药物分子有效编码,通过对有效编码进行归一化的操作得到最终需要的原子特征向量,将原子特征向量进行整合,获得药物分子特征矩阵其中,为药物分子中每个原子的特征向量,N为药物分子中原子节点的数量;n表示分子中原子节点数量或化学键数量;(2)模型训练;
将Edge、X输入所述自注意力编码器的药物分子属性预测模型中,进行模型训练;训练达到预设次数后结束训练,获得训练好的模型。4.根据权利要求1

3任意一项所述的基于深度学习预测模型的药物分子有效性验证方法,其特征在于:所述通过自注意力编码器的药物分子属性预测模型进行药物分子属性预测,具体实现包括以下步骤:步骤1.1:从药物分子的图数据中提取药物分子的特征信息,特征信息进行归一化聚合操作后可得到特征矩阵步骤1.2:利用编码器对特征矩阵X

进行映射操作,特征矩阵经过线性变换操作,得到查询矩阵、键矩阵和值矩阵然后通过计算得到它们的注意力分数head,使用softmax函数对其进行归一化操作,定义如下所示:其中,T表示矩阵的转置操作;Att(Q,K,V)表示通过注意力得分计算公式得到的注意力得分;多头注意力机制中,输入的信息在不同的子空间中进行表示,定义为如下公式:Mha(Q,K,V)=[head1,head2,

,head
h
]W;其中,Mha(Q,K,V)表示经过多头注意力机制计算得到的注意力分数;为三个学习得到的权重矩阵,d表示特征维度,h表示注意力头数;为权重矩阵;head
i
表示第i个头对输入进行自注意力计算后得到的结果;提取出药物分子高阶特征向量X

:Z=X

+dropout(Mha(X

,X

,X

))X

=normal(Z+dropout(normal(FFN(Z)))其中,dropout表示随机丢弃神经元,normal表示归一化操作,FFN为前馈神经网络;步骤1.3:提取来自药物分子指纹的特征信息;对SMILES进行转换,将其转换为分子指纹的MACCS分子指纹、Pharmacophore ErG分子指纹、PubChem分子指纹的表示形式;根据三种分子指纹生成一种包含多种分子指纹信息的混合分子指纹,获得混合分子指纹描述序列FP:FP=(FP
PubChem
||FP
MACSS
||FP
Pharmacophre ErG
);该...

【专利技术属性】
技术研发人员:胡文斌刘政伸
申请(专利权)人:武汉大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1