当前位置: 首页 > 专利查询>青岛大学专利>正文

一种基于子结构图卷积的分子特征提取方法技术

技术编号:37793598 阅读:20 留言:0更新日期:2023-06-09 09:23
本发明专利技术公开了一种基于子结构图卷积的分子特征提取方法。本发明专利技术方法通过构建分子图结构,获取分子图结构中各原子点的原子特征后,基于混合多阶图卷积方法提取各原子点的多阶原子特征,结合注意力模型得到原子混合多阶向量,再建立子结构图获取各节点的节点特征后,根据原子混合多阶向量和子结构向量,基于融合子结构的交叉卷积方法,分别对混合多阶分子特征和一阶节点特征进行卷积计算并进行拼接,得到分子图结构中各原子点内各层的分子图卷积值,得到分子图结构中各原子点的分子特征属性,从而确定分子的分子特征。本发明专利技术充分综合了分子内各原子的原子特征及关联关系,有效避免了分子中关键基团信息的丢失,实现了对分子特征的精确提取。特征的精确提取。特征的精确提取。

【技术实现步骤摘要】
一种基于子结构图卷积的分子特征提取方法


[0001]本专利技术涉及分子特征提取
,具体涉及一种基于子结构图卷积的分子特征提取方法。

技术介绍

[0002]计算机辅助药物设计(CADD)的出现提升了药物研发的效率,已成为新药设计过程中不可或缺的工具。利用计算机算法能够预测蛋白质的三维结构、提取分子药效团、预测分子性质。
[0003]随着大数据时代的到来,化合物越来越多,需要利用计算机辅助的方法在如此大量数据中预筛出有效的化合物进行生物实测,但是由于分子结构较为复杂,如何能找到合适的用于描述分子结构的模型对于特征提取至关重要。分子结构主要由原子相连接组成,具有一定的柔性,传统的卷积神经网络无法适用于该结构中。随着图卷积神经网络的出现,通过将分子结构转换成图结构(原子作为点,连接作为边)并进行卷积有效挖掘原子间的关联关系,提取分子特征。
[0004]但是,现有的利用图卷积提取分子特征的方法均仅仅是将单一原子作为节点,没有考虑官能团在分子中的作用,既没有针对分子子结构的处理,也没有实现对官能团信息的嵌入。因此,亟需提出一种基于子结构图卷积的分子特征提取方法,实现分子特征提取的精确性。

技术实现思路

[0005]本专利技术针对现有方法难以精确提取分子特征的问题,提出了一种基于子结构图卷积的分子特征提取方法,充分考虑了分子中的原子特征和官能团信息,利用融合子结构的交叉图卷积方法将药物分子的分子图结构信息与子结构图信息相融合,有效挖掘了分子中各原子之间的关联关系,提高了分子特征提取的准确性,为精确预测分子性质提供了依据。
[0006]本专利技术采用以下的技术方案:
[0007]一种基于子结构图卷积的分子特征提取方法,具体包括以下步骤:
[0008]步骤1,根据药物分子的分子结构,构建药物分子的分子图结构,获取药物分子的邻接矩阵和特征矩阵,得到分子图结构中各原子点所对应的原子特征;
[0009]步骤2,根据分子图结构中各原子点所对应的各阶原子特征,基于混合多阶图卷积方法提取分子图结构内各原子点的多阶原子特征,并结合注意力模型计算注意力,确定分子图结构内各原子点的混合多阶分子特征,得到原子混合多阶向量;
[0010]步骤3,根据药物分子的分子图结构提取药物分子中的成环分子结构以及非成环分子结构,获取药物分子的子结构图,提取子结构图中所有的键特征,确定子结构图中各节点的节点特征;
[0011]步骤4,根据药物分子的子结构图和分子图结构,基于融合子结构的交叉卷积方法将子结构信息融入至分子图卷积中,对子结构图中各节点的节点特征进行一阶卷积处理,
构建子结构向量再分别针对分子图结构中的各原子点,利用原子混合多阶向量和子结构向量获取原子点内各层的混合多阶分子特征和一阶节点特征,分别对混合多阶分子特征和一阶节点特征进行卷积计算并进行拼接,得到分子图结构中各原子点内各层的分子图卷积值;
[0012]步骤5,根据分子图结构中所有原子点内各层的分子图卷积值,分别确定分子图结构中各原子点分子图卷积的平均值以及各原子点分子图卷积的最大值并进行拼接,得到分子图结构中各原子点的分子特征属性,确定药物分子的分子特征。
[0013]优选地,所述步骤1中,根据药物分子的分子结构,获取药物分子中各原子的原子特征,以药物分子中除氢键之外的各原子作为原子点、药物分子各原子的连接关系作为边,构建药物分子的分子图结构,如公式(1)所示:
[0014]G
atom
=(A
atom
,X
atom
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)
[0015]式中,为药物分子的邻接矩阵,用于表示药物分子中原子之间的连接关系,当药物分子中原子i与原子j相连接时,A
atom
(i,j)=1,当药物分子中原子i与原子j未连接时,A
atom
(i,j)=0;为药物分子的特征矩阵,用于记录药物分子中各原子的原子特征;M为药物分子中原子的数量,D为药物分子中原子特征的维度。
[0016]优选地,所述原子特征包括原子类型、原子度、自由基和芳香性。
[0017]优选地,所述步骤2中,具体包括以下步骤:
[0018]步骤2.1,根据分子图结构中各原子点所对应的各阶原子特征,对分子图结构中各原子点的各阶原子特征进行线性变换,如公式(2)所示:
[0019]V
atom
(m)=σ(W
atom
X
atom
(m)+b
atom
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(2)
[0020]式中,W
atom
、b
atom
均为图卷积模型的学习参数,σ为激活函数,m为分子图结构中原子点的编号,V
atom
为原子点的线性原子特征;
[0021]步骤2.2,根据分子图结构中各原子点的各阶线性原子特征,基于多阶图卷积方法,利用图卷积模型分别对分子图结构中的各原子点进行多阶图卷积计算,确定分子图结构中所有原子点的多阶线性原子特征,如公式(3)所示:
[0022][0023]式中,为p阶第l层的卷积函数;均为训练参数;N
p
(m)为原子点m的所有p阶邻居集合;p为阶数,当p=0时,N
p
(m)为空,卷积计算仅考虑原子点本身,不涉及原子点的p阶邻居;当p>0时,原子点m的所有p阶邻居均参与卷积计算;
[0024]再构建注意力模型,利用注意力模型分别计算各原子点多阶线性原子特征所对应的注意力,如公式(4)所示:
[0025][0026]式中,z
p
为原子点p阶原子特征所对应的注意力;
[0027]步骤2.3,根据各原子点的多阶线性原子特征和注意力,计算得到分子图结构内各原子点的混合多阶分子特征,构建原子混合多阶向量,如公式(5)所示:
[0028][0029]式中,为原子点第l层的混合多阶分子特征。
[0030]优选地,所述步骤3中,根据药物分子的分子图结构,分别提取药物分子中的成环分子结构以及非成环分子结构作为子结构,将子结构简化为节点生成子结构图,在子结构图提取药物分子的键特征,将药物分子中各原子的原子特征与键特征相融合后,确定子结构图中各节点的节点特征,如公式(6)所示:
[0031][0032]式中,s为子结构,m为节点编号,e为化学键;[
·
]为特征拼接函数;V
sub
(s)为子结构s的节点特征,由子结构中所有原子的原子特征X
atom
和所有化学的原始特征X
bond
经过线性变换得到。
[0033]优选地,所述子结构图除了包括药物分子中各原子的原子特征外,还包括药物分子中各原子之间的键特征,包括键类型、立体描述符、芳香键和环状态。
[0034]优选地,所述步本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于子结构图卷积的分子特征提取方法,其特征在于,具体包括以下步骤:步骤1,根据药物分子的分子结构,构建药物分子的分子图结构,获取药物分子的邻接矩阵和特征矩阵,得到分子图结构中各原子点所对应的原子特征;步骤2,根据分子图结构中各原子点所对应的各阶原子特征,基于混合多阶图卷积方法提取分子图结构内各原子点的多阶原子特征,并结合注意力模型计算注意力,确定分子图结构内各原子点的混合多阶分子特征,得到原子混合多阶向量;步骤3,根据药物分子的分子图结构提取药物分子中的成环分子结构以及非成环分子结构,获取药物分子的子结构图,提取子结构图中所有的键特征,确定子结构图中各节点的节点特征;步骤4,根据药物分子的子结构图和分子图结构,基于融合子结构的交叉卷积方法将子结构信息融入至分子图卷积中,对子结构图中各节点的节点特征进行一阶卷积处理,构建子结构向量再分别针对分子图结构中的各原子点,利用原子混合多阶向量和子结构向量获取原子点内各层的混合多阶分子特征和一阶节点特征,分别对混合多阶分子特征和一阶节点特征进行卷积计算并进行拼接,得到分子图结构中各原子点内各层的分子图卷积值;步骤5,根据分子图结构中所有原子点内各层的分子图卷积值,分别确定分子图结构中各原子点分子图卷积的平均值以及各原子点分子图卷积的最大值并进行拼接,得到分子图结构中各原子点的分子特征属性,确定药物分子的分子特征。2.根据权利要求1所述的一种基于子结构图卷积的分子特征提取方法,其特征在于,所述步骤1中,根据药物分子的分子结构,获取药物分子中各原子的原子特征,以药物分子中除氢键之外的各原子作为原子点、药物分子各原子的连接关系作为边,构建药物分子的分子图结构,如公式(1)所示:G
atom
=(A
atom
,X
atom
)
ꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀꢀ
(1)式中,为药物分子的邻接矩阵,用于表示药物分子中原子之间的连接关系,当药物分子中原子i与原子j相连接时,A
atom
(i,j)=1,当药物分子中原子i与原子j未连接时,A
atom
(i,j)=0;为药物分子的特征矩阵,用于记录药物分子中各原子的原子特征;M为药物分子中原子的数量,D为药物分子中原子特征的维度。3.根据权利要求2所述的一种基于子结构图卷积的分子特征提取方法,其特征在于,所述原子特征包括原子类型、原子度、自由基和芳香性。4.根据权利要求2所述的一种基于子结构图卷积的分子特征提取方法,其特征在于,所述步骤2中,具体包括以下步骤:步骤2.1,根据分子图结构中各原子点所对应的各阶原子特征,对分子图结构中各原子点的各阶原子特征进行线性变换,如公式(2)所示:V
atom
(m)=σ(W
atom
X
atom...

【专利技术属性】
技术研发人员:李臻赵海光张元明潘守润徐磊夏雷鸣
申请(专利权)人:青岛大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1