当前位置: 首页 > 专利查询>东南大学专利>正文

一种基于图神经网络的抗肿瘤分子强化方法技术

技术编号:37249937 阅读:8 留言:0更新日期:2023-04-20 23:28
本发明专利技术设计一种基于图神经网络的抗肿瘤分子强化学习方法,该方法包含以下步骤:步骤1:根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别,步骤2:将所得图输入提出的抗肿瘤分子强化模型,根据阳性分子和阴性分子的不同性质学习图的隐式表示,获得抗肿瘤分子的局部结构特征,用于分子的一步生成和优化,步骤3:施加约束,进行目标优化,确保对分子强化过程中分子的类药性,步骤4:将获得的局部分子结构代入进行抗肿瘤分子的结构修改、优化,步骤5:使用已有分子性质合理检测工具,判断可合成性,输出合理分子,而针对不合理分子,进一步反向优化,步骤6:获得合理的新型抗肿瘤分子,任务结束。任务结束。任务结束。

【技术实现步骤摘要】
一种基于图神经网络的抗肿瘤分子强化方法


[0001]本专利技术涉及一种基于图神经网络的药物分子强化技术,属于抗肿瘤药物分子化学研究和图神经网络强化学习


技术介绍

[0002]描述与本专利技术最接近的现有技术的状况和存在的问题。
[0003]药物分子的优化、新药的研究对于肿瘤的治疗至关重要。药物分子优化的目标是为了强化特定方向上更加理想的生物学效应,同时保证生物药物学上的可接受性。目前的问题是开发高效药物的高时间与金钱成本。目前的药物研究领域,传统的策略是基于已有的化合物库进行筛选。但由于现有化合物库里分子的结构多样性有限,并且研究机构早已多次筛选过,所以在这上面再进行高效药物分子的发现与创新已经越来越有挑战性。
[0004]随着机器学习的发展,它在药物发现领域的作用越来越大,相较于传统的筛选策略,将机器学习与分子研究进行融合对任务的处理将更具有有效性与可扩展性。
[0005]目前,该领域相关人员开辟了一种“从头分子设计技术”——基于原子、基于片段、基于反应的分子设计方法,通过分析计算从零开始生成具有高有效性的新分子。它的设计想法是:摒弃传统的粗暴的直接筛选方法,平衡全局与局部,探索重点特征,基于线索构建目标分子。其弊端是,这种方法需要从零开始的高手动化生成与分子架构;同时,明确的设计目标和规范化的设计原则对于结果的可解释性也是必须的。同时,由于从头分子设计基于片段而言,所以生成分子的质量与前期的操作也不可分割。总之,从头设计方法目前的突出挑战是高计算量、低可解释性,生成结果对前期选择的高度依赖性。

技术实现思路

[0006]技术问题:争对以上问题,本专利技术提出了一种基于图神经网络的抗肿瘤药物分子强化学习方法。构造分子抗肿瘤性加强图神经网络模型,基于药物分子进行特征提取与分子性质分类;通过修改特征观察分类结果从而提取关键特征。利用关键特征的分析在原来分子结构基础上进行化学强化与修改,最后得到具有更强目标特性的新分子,从而提高分子生成的效率与可解释性,降低抗肿瘤分子药物的研究开发难度与开发周期、成本。
[0007]技术方案:为实现本专利技术的目的,本专利技术所采用的技术方案是:一种基于图神经网络的抗肿瘤分子强化方法,该方法包括以下步骤:
[0008]步骤1:根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别。将每个输入分子描述为无向图(图矩阵),其中节点和边分别对应于原子和化学键。构建图神经网络(Graph neural networks)模型,以生成分子的化学稳定性和分子类药性为损失函数,并预训练。
[0009]步骤2:将所得图输入提出的抗肿瘤分子强化模型,根据阳性分子和阴性分子的不同性质学习图的隐式表示,获得抗肿瘤分子的局部结构特征,用于分子的一步生成和优化。
[0010]步骤3:施加约束,进行目标优化,确保对分子强化过程中分子的类药性。
[0011]步骤4:将获得的局部分子结构代入进行抗肿瘤分子的结构修改、优化。
[0012]步骤5:使用已有分子性质合理检测工具,判断可合成性,输出合理分子。而针对不合理分子,进一步反向优化。
[0013]步骤6:获得合理的新型抗肿瘤分子,任务结束。
[0014]进一步的,步骤(1)中,根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别。将每个输入分子描述为无向图(图矩阵),其中节点和边分别对应于原子和化学键。构建图神经网络(Graph neural networks)模型并预训练,方法如下:
[0015](101)以图的方式输入分子,包括G=(V,E,X),其中G表示输入分子,V表示分子的原子,为1
×
n的One

hot编码格式,E表示分子化学键,为一个n
×
n大小的邻接矩阵,X为分子的各个原子的特征,为一个n
×
n大小的矩阵。将每个输入分子描述为无向图(图矩阵),也就是G。
[0016](102)根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别,用G
+
或G

表示。
[0017](103)构建图神经网络(Graph neural networks)模型,其输入为原始分子无向图G,输出为二分类概率矩阵P,以生成分子的化学稳定性和分子类药性为损失函数,对该GNN模型进行预训练。
[0018]进一步的,步骤(2)中,将所得图输入提出的抗肿瘤分子强化模型,根据阳性分子和阴性分子的不同性质学习图的隐式表示,获得抗肿瘤分子的局部结构特征,用于分子的一步生成和优化。方法如下:
[0019](201)将所得到的分子G输入进特征提取模型f:G

F∈R
n
×
h
提取出分子的隐式特征F
[0020](202)特征提取模型f:G

F∈R
n
×
h
包括:(1)
[0021][0022][0023]其中表示在第l

1层获取的各个分子的特征,为矩阵第j行内容,N(v)为v的邻居节点,UPDATE为每一层的更新函数,AGG为聚合函数,READOUT为读出函数,在经过l次迭代后获取分子的特征
[0024](2)以获得的h
G
作为输入,通过一个MLP模型获取分子的隐式特征F。
[0025](203)将得到的隐式特征F输入分类预测网络c:F

P
out
∈R
n
×2,得到二分类概率结果矩阵P
u

[0026](204)对得到的分子结构进行部分变换,带入特征提取模型,得到变换后的隐式特征F',将得到的隐式特征F'输入分类预测网络,得到二分类概率结果矩阵P
n

[0027](205)将步骤(203)和步骤(204)分别得到的概率结果输入概率波动函数PFF(Fluctuation probability function),带入MEAS(measure)函数,分析PFF的计算结果,
[0028]PFF=||p
u

p
n
||
[0029]S
out
=MEAS{PFF(P
u
,P
n
)}
[0030]提取更改后影响概率波动程度大的分子局部结构特征S
out
,将此作为输出。
[0031]进一步的,步骤(3)中,施加约束,进行目标优化,确保对分子强化过程中分子的类
药性,方法如下:
[0032](301)在训练抗肿瘤分子强化模型时在MEAS函数中利用QED数值
[0033]进行约束
[0034]MEAS:S
out
=RF{PFF(P
u
,P
n
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图神经网络的抗肿瘤分子强化学习方法,其特特征在于,该方法包含以下步骤:步骤1:根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别,将每个输入分子描述为无向图(图矩阵),其中节点和边分别对应于原子和化学键,构建图神经网络(Graph neural networks)模型,以生成分子的化学稳定性和分子类药性为损失函数,针对节点分类任务进行预训练,步骤2:将所得图输入提出的抗肿瘤分子强化模型,根据阳性分子和阴性分子的不同性质学习图的隐式表示,获得抗肿瘤分子的局部结构特征,用于分子的一步生成和优化,步骤3:施加约束,进行目标优化,确保对分子强化过程中分子的类药性,步骤4:将获得的局部分子结构代入进行抗肿瘤分子的结构修改、优化,步骤5:使用已有分子性质合理检测工具,判断可合成性,输出合理分子,而针对不合理分子,进一步反向优化,步骤6:获得合理的新型抗肿瘤分子,任务结束。2.根据权利要求1所述的一种基于图神经网络的抗肿瘤分子强化学习方法,其特征在于,步骤1中,根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别,将每个输入分子描述为无向图(图矩阵),其中节点和边分别对应于原子和化学键,构建图神经网络(Graph neural networks)模型并预训练,具体方法如下:(101)以图的方式输入分子,包括G=(V,E,X),其中G表示输入分子,V表示分子的原子,为1
×
n的One

hot编码格式,E表示分子化学键,为一个n
×
n大小的邻接矩阵,X为分子的各个原子的特征,为一个n
×
n大小的矩阵,将每个输入分子描述为无向图即图矩阵,也就是G;(102)根据数据库中的分子标签将分子分为抗肿瘤(阳性)、非抗肿瘤(阴性)类别,用G
+
或G

表示;(103)构建图神经网络(Graph neural networks)模型,其输入为原始分子无向图G,输出为二分类概率矩阵P,对该GNN模型进行预训练。3.根据权利要求2所述的输入的数据库药物分子,其特征在于,步骤(2)中,将所得图输入提出的抗肿瘤分子强化模型,根据阳性分子和阴性分子的不同性质学习图的隐式表示,获得抗肿瘤分子的局部结构特征,用于分子的一步生成和优化,方法如下:(201)将所得到的分子G输入进特征提取模型f:G

F∈R
n
×
h
提取出分子的隐式特征F,(202)特征提取f:G

F∈R
n
×
h
模型包括:(1)模型包括:(1)其中表示在第l

1层获取的各个分子的特征,为矩阵第j行内容,N(v)为v的邻居节点,UPDATE为每一层的更新函数,AGG为聚合函数,READOUT为读出函数,在经过l次迭代后获取分子的特征(2)以获得的h
G
作为输入,通过一个MLP模型获取分子的隐式特征F,(203)将得到的隐式特征F输入分类预测网络
c:F

P
out
∈R
n
×2得到二分类概率结果矩阵P
u
,(204)对得到的分子结构进行部分变换,带入特征提取模型,得到变换后的隐式特征F'将得到的隐式特征F'输入分类预测网络,得到二分类概率结果矩阵P
n
,(205)将步骤(203)和步骤(204)分别得到的概率结果输入概率变化函数PFF(Fluctuation probability function),带入MEAS(measure)函数,分析PFF的计算结果PFF=||p
u

p
n
||S
out
=MEAS{PFF(P
u
,...

【专利技术属性】
技术研发人员:施喻甜王贝伦金桥王玟雯
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1