基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法技术

技术编号:39644886 阅读:9 留言:0更新日期:2023-12-09 11:12
本发明专利技术公开了一种基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法,包括以下步骤:

【技术实现步骤摘要】
基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法、装置及设备


[0001]本专利技术涉及生物信息
,特别涉及一种基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法

装置及设备


技术介绍

[0002]血脑屏障是一种高度选择性的半渗透性膜屏障,存在于大脑中,由选择性紧密连接组成,用于将中枢神经系统与循环系统分开

血脑屏障保护大脑免受侵入性的外源性化学物质的影响,以维持大脑的稳态

它主要由脑内皮细胞构成,可阻止较大分子和小分子进入中枢神经系统,只允许水溶性和脂溶性分子以及选择性运输分子跨越其自身进行转运

由于这一屏障,大多数药物分子不能进入大脑,因此对中枢神经系统疾病没有治疗作用

因此,预测药物血脑屏障通透性对于中枢神经系统疾病治疗药物开发至关重要

在传统的预测方法中,药物血脑屏障通透性预测是通过体外血脑屏障模型或动物实验直接进行的,其存在着设备要求特殊

操作复杂

实验周期长和高花费等缺点,所以可以设计一个高效准确的计算方法可以为生物实验提供指导,使得预测药物血脑屏障通透性更有效率

[0003]例如
Wang
等人
2018
年在
《ChemMedChem》
公开了一种基于机器学习和重采样方法的化合物血脑屏障通透性预测方法,该方法将
MACSS、SMOTE、ENN
以及
SVM
相结合并构建共识模型预测化合物血脑屏障通透性
。Singh
等人
2019
年在
《Journal of Molecular Graphics and Modelling》
公开了一种药物血脑屏障通透性预测方法,该方法使用共识
QSAR
方法将
RF、MLP

SMO
相结合并构建共识模型预测化合物血脑屏障通透性
。Shaker
等人
2021
年在
《Bioinformatics》
公开了一种化合物血脑屏障通透性预测方法
LightBBB

LightBBB
训练一个基于
LightGBM
算法的机器学习模型来预测化合物血脑屏障通透性
。Ding
等人
2022
年在
《Bioinformatics》
公开了一种药物血脑屏障通透性预测方法:利用关系图卷积神经网络预测药物血脑屏障通透性,该方法利用关系图卷积神经网络从药物

蛋白质异构图中学习药物的嵌入表征,并送入单层感知机中预测药物血脑屏障通透性

[0004]尽管上述方法对药物血脑屏障通透性的研究是有效的,但仍存在很多不足的地方

一方面,一些方法对药物血脑屏障通透性预测有用的信息利用不充分,没有综合考虑各种药物特征数据;另一方面,一些方法在在学习药物嵌入特征时存在过度平滑和过度参数化的问题

导致预测效果不理想

[0005]鉴于此,有必要提供一种新的方法解决上述技术问题


技术实现思路

[0006]本专利技术要解决的技术问题是提供一种基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法,能有效提高药物血脑屏障通透性预测的准确性,从而解决现有技术中存在的预测准确率较低的技术问题

其技术方案如下:
[0007]本专利技术的一种基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法,
所述方法包括以下步骤:
[0008]S1
,利用药物的
SMILES
序列计算药物的
Mordred
分子描述符特征矩阵和药物结构相似性矩阵,并将所述
Mordred
分子描述符特征矩阵和所述药物结构相似性矩阵前后拼接构成药物的初始特征矩阵,构建蛋白质的初始特征矩阵;
[0009]S2
,利用多约束的多关系图神经网络从药物

蛋白质异构图中学习药物的嵌入特征;
[0010]S3
,将药物的嵌入特征送入单层感知机预测药物分子的血脑屏障通透性

[0011]进一步地,步骤
S1
中,从多个文献中收集被标注血脑屏障通透性的药物,从
STITCH
数据库收集药物

蛋白质相互作用和药物的
SMILES
序列,计算药物的
Mordred
分子描述符特征矩阵和药物结构相似性矩阵,并将所述
Mordred
分子描述符特征矩阵和所述药物结构相似性矩阵前后拼接构成药物的初始特征矩阵,将蛋白质的特征作为可学习参数,构建药物

蛋白质异构图

其中,“多个文献”例如:
Wang
等人
2018
年在
《ChemMedChem》
发表的文章基于机器学习和重采样方法的化合物血脑屏障通透性预测
、Shaker
等人
2021
年在
《Bioinformatics》
发表的文章
LightBBB、Alsenan
等人
2021
年在
《PeerJ Computer Science》
发表的文章基于深度学习方法的血脑屏障通透性预测
、Singh
等人
2019
年在
《Journal of Molecular Graphics and Modelling》
公开了一种药物血脑屏障通透性预测方法
、Ding
等人
2022
年在
《Bioinformatics》
公开了一种药物血脑屏障通透性预测方法,等等

[0012]进一步地,构建药物的初始特征矩阵,包括以下步骤:
[0013]步骤
S11a
,计算药物的
Mordred
分子描述符,包括:从
STITCH
数据库获取药物的
SMILES
序列,并使用
DeepChem
库提供的分子特征器生成药物的
Mordred
分子描述符,将
Mordred
分子描述符作为药物的第一种特征,从而得到
Mordred
分子描述符特征矩阵
N
d
为药物的数量;
[0014]步骤
S12a
,计算药物结构相似性,包括:将药物的
SMILES
序列输到
RDk本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种基于多约束的多关系图神经网络的药物血脑屏障通透性预测方法,其特征在于,所述方法包括以下步骤:
S1
,利用药物的
SMILES
序列计算药物的
Mordred
分子描述符特征矩阵和药物结构相似性矩阵,并将所述
Mordred
分子描述符特征矩阵和所述药物结构相似性矩阵前后拼接构成药物的初始特征矩阵,构建蛋白质的初始特征矩阵;
S2
,利用多约束的多关系图神经网络从药物

蛋白质异构图中学习药物的嵌入特征;
S3
,将药物的嵌入特征送入单层感知机预测药物分子的血脑屏障通透性
。2.
根据权利要求1所述的预测方法,其特征在于,步骤
S1
中,从多个文献中收集被标注血脑屏障通透性的药物,从
STITCH
数据库收集药物

蛋白质相互作用和药物的
SMILES
序列,计算药物的
Mordred
分子描述符特征矩阵和药物结构相似性矩阵,并将所述
Mordred
分子描述符特征矩阵和所述药物结构相似性矩阵前后拼接构成药物的初始特征矩阵,将蛋白质的特征作为可学习参数,构建药物

蛋白质异构图
。3.
根据权利要求2所述的预测方法,其特征在于,构建药物的初始特征矩阵,包括以下步骤:步骤
S11a
,计算药物的
Mordred
分子描述符,包括:从
STITCH
数据库获取药物的
SMILES
序列,并使用
DeepChem
库提供的分子特征器生成药物的
Mordred
分子描述符,将
Mordred
分子描述符作为药物的第一种特征,从而得到
Mordred
分子描述符特征矩阵
N
d
为药物的数量;步骤
S12a
,计算药物结构相似性,包括:将药物的
SMILES
序列输到
RDkit
,从而生成药物的二维药效团指纹;根据
Jaccard
评分计算药物的结构相似性,得到药物结构似性矩阵公式如下:其中,
fv
i

fv
j
分别代表与药物
d
i

d
j
对应的药效团指纹;步骤
S13a
,将药物的
Mordred
分子描述符特征矩阵
DMF
和药物结构相似性矩阵
DSM
在水平方向上拼接构成药物的初始特征矩阵
4.
根据权利要求2所述的预测方法,其特征在于,构建药物

蛋白质异构图,包括以下步骤:步骤
S11b
,从
STITCH
数据库收集药物

蛋白质相互作用,相互作用可以分为4类,以药物和蛋白质作为2种节点,4类药物

蛋白质相互作用和药物

药物相似性作为5种边构建药物

蛋白质异构图;步骤
S12b
,将药物

蛋白质异构图在关系
r
下的邻接矩阵记为
A
r
∈R
n
×
n

n
表示图的节点数目,对角度矩阵记为
D
r
,使用和分别表示添加自环后的邻接矩阵和对角度矩阵;步骤
S13b
:对进行归一化,并计算关系

【专利技术属性】
技术研发人员:严承储爽唐嘉悦
申请(专利权)人:湖南中医药大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1