一种多尺度的药物-药物反应可解释预测方法和系统技术方案

技术编号:39734994 阅读:11 留言:0更新日期:2023-12-17 23:37
本发明专利技术提出了一种多尺度药物

【技术实现步骤摘要】
一种多尺度的药物

药物反应可解释预测方法和系统


[0001]本专利技术属于药物相互作用预测
,尤其涉及一种多尺度的药物

药物反应可解释预测方法和系统


技术介绍

[0002]药物相互作用一直以来被描述为一种药物的药效因另一种药物的存在而发生的变化

因为有些疾病太复杂而不能用单一药物治疗,或者多种疾病需要多种药物,一种以上药物的同时给药可以证明是合理的而且常见的

然而,同时使用多种药物可能会导致药物不良反应
(Adverse Drug Reaction

ADR)。
据估计,不良副作用的报告中有
30%
的概率与药物相互作用
(Drug

Drug Interaction

DDI)
有关,并且其是药物退出市场的主要原因之一

有效识别潜在的
DDI
可以最小化意外
ADR
并最大限度地发挥药物间的协同效应

因此,预测潜在的
DDI
对缓解意外药理作用的影响至关重要,在医生

患者和社会层面意义重大

[0003]尽管
DDI
可以通过体内和体外实验来鉴定,但由于药物数量众多且快速增长,传统的实验方法既耗时繁琐又成本高昂,即使使用高通量方法也需要耗费大量的人力和金钱

此,开发一种智能的计算方法来辅助完成
DDI
预测显得尤为重要

近年来,深度学习的先进技术使得
DDI
的预测任务取得了卓越的结果

深度学习可以从大规模的

嘈杂的药物信息中提取药物特征,减少对手动设计特征的依赖

深度学习的大规模应用使得模型在规模有限的数据集上能够训练达到更高精度,在
DDI
的确定上具有很大的潜力

[0004]然而,在现存大多数基于深度学习的
DDI
预测算法中,药物表示学习方法将信息建模在单一视图上,它仅限于考虑药物的结构

序列或相互作用信息,未考虑药物之间的协同作用,阻碍了
DDI
预测精度的提高

同时,传统的方法特征的设计方式是捕获药物的整个分子结构,而有资料证明
DDI
通常仅依赖于整个化学结构的几个子结构

考虑整个分子结构可能会使预测受到不相关的数据的干扰

此外,深度学习系统因为复杂的网络结构常常使结果失去实际的物理意义,令深度学习的结果难以被人理解,影响采用深度学习进行决策的信任度


技术实现思路

[0005]为克服上述现有技术的不足,本专利技术提供了一种多尺度的药物相互作用可解释预测方法及系统
(Multi

level Interpretable Drug

Drug Interaction, MI

DDI)。
为高效利用药物的丰富信息并广泛应用,设计从原子级和子结构级两个尺度提取药物特征并进行融合;为了使
DDI
预测结果具有可解释性,本专利技术使用了交互图明确
DDI
反应的关键路径

[0006]为实现上述目的,本专利技术提供如下技术方案:本专利技术第一方面提供了一种基于深度学习的多尺度药物

药物反应可解释预测方法,包括如下步骤:步骤
S1
,获取待预测两种药物的两种机理特征,分别为:分子图和文本序列;步骤
S2
,使用分子图时,采用门控图神经网络提取并整合各种原子节点信息和化
学键信息,获取药物所有节点的原子级特征向量;步骤
S3
,使用文本序列时,先进行频繁子结构挖掘,得到子结构序列,再利用变压器的编码部分赋予子结构序列不同的位置权重和内容权重,获取子结构级特征向量;步骤
S4
,将原子级和子结构级两个尺度的特征向量整理成相同的指定长度,然后合并得到特征矩阵;步骤
S5
,将特征矩阵转化为可以使用原子
/
子结构解释的交互矩阵,利用交互矩阵对两种药物进行加权计算,得到加权特征;步骤
S6
,将加权特征与原始特征矩阵连接后输入到预测模块,得到待预测的两种药物之间的相互作用结果

[0007]进一步的,步骤
S2
的具体实现方式如下:
S2.1
,门控图神经网络中,一个分子表示为一个无向图
G(V,E)

V
是节点集合,
E
是边集合,节点特征被表示为
h
v

边缘特征被表示为
e
vw

v

w
为节点集合中的两个节点,,每个节点在时间步
t=0
时被初始化为;
S2.2
,节点
v
在时间步
t
的状态被表示为,节点
w
在时间步
t
的状态被表示为,根据以下公式更新节点
v
在时间步
t+1
时的状态:
[0008][0009]其中,为中间消息,
N(v)

v
的相邻节点的集合,
M
t

U
t
分别是消息函数和顶点更新函数;经过
t
个时间步,通过聚合层
g
得到节点
v
的特征向量;
[0010]S2.3
,利用多个消息传递层将原子节点的特征向量
F
v
输出为分子图的嵌入向量以表示整个分子图,嵌入向量即为原子级特征向量

[0011]进一步的,步骤
S3
中利用频繁子序列挖掘
FCS
将药物的文本序列即简化分子线性输入规范
SMILES
序列分层分解为子结构序列,包括如下子步骤:
S3.1.1
,初始化用来表示药物的词汇集
D

SMILES 字符串字符,并标记整个药物语料库,记为标记化集
W

S3.1.2
,扫描
W
并标识最常见的连续标记
(A,B)

S3.1.3

FCS 更新标记化集
W
中的每个
(A,B)
使用新标记
(AB)
,并将此新标记添加到词汇表中
D

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种多尺度的药物

药物反应可解释预测方法,其特征在于,包括如下步骤:步骤
S1
,获取待预测两种药物的两种机理特征,分别为:分子图和文本序列;步骤
S2
,使用分子图时,采用门控图神经网络提取并整合各种原子节点信息和化学键信息,获取药物所有节点的原子级特征向量;步骤
S3
,使用文本序列时,先进行频繁子结构挖掘,得到子结构序列,再利用变压器的编码部分赋予子结构序列不同的位置权重和内容权重,获取子结构级特征向量;步骤
S4
,将原子级和子结构级两个尺度的特征向量整理成相同的指定长度,然后合并得到特征矩阵;步骤
S5
,将特征矩阵转化为可以使用原子
/
子结构解释的交互矩阵,利用交互矩阵对药物进行加权计算,得到加权特征;步骤
S6
,将每一种药物的加权特征与对应的特征矩阵进行连接获得拼接矩阵,然后将两种药物的拼接矩阵进行拼接,并输入到预测模块,得到待预测的两种药物之间的相互作用结果
。2.
如权利要求1所述的一种多尺度的药物

药物反应可解释预测方法,其特征在于:步骤
S2
的具体实现方式如下:
S2.1
,门控图神经网络中,一个分子表示为一个无向图
G(V,E)

V
是节点集合,
E
是边集合,节点特征被表示为
h
v

边缘特征被表示为
e
vw

v

w
为节点集合中的两个节点,,每个节点在时间步
t=0
时被初始化为;
S2.2
,节点
v
在时间步
t
的状态被表示为,节点
w
在时间步
t
的状态被表示为,根据以下公式更新节点
v
在时间步
t+1
时的状态:
;;
其中,为中间消息,
N(v)

v
的相邻节点的集合,
M
t

U
t
分别是消息函数和顶点更新函数;经过
t
个时间步,通过聚合层
g
得到节点
v
的特征向量;
;S2.3
,利用多个消息传递层将原子节点的特征向量
F
v
输出为分子图的嵌入向量以表示整个分子图,嵌入向量即为原子级特征向量
。3.
如权利要求1所述的一种多尺度的药物

药物反应可解释预测方法,其特征在于:步骤
S3
中利用频繁子序列挖掘
FCS
将药物的文本序列即简化分子线性输入规范
SMILES
序列分层分解为子结构序列,包括如下子步骤:
S3.1.1
,初始化用来表示药物的词汇集
D

SMILES 字符串字符,并标记整个药物语料库,记为标记化集
W

S3.1.2
,扫描
W
并标识最常见的连续标记
(A,B)

S3.1.3

FCS 更新标记化集
W
中的每个
(A,B)
使用新标记
(AB)
,并将此新标记添加到词汇表中
D

S3.1.4
,重复扫描

识别

更新的过程,直到没有频繁的标记超过阈值 r 或
D
中的数量达到预定义的最大值;
S3.1.5
,频繁的子序列合并为一个标记,频率未达到
r
的子序列分解为一组更短的标记;对于某药物,
FCS
将产生子结构序列
C={c1,
...

c
k
}
,序列大小为 k ,其中每个
c
i
来自集合
D

S3.1.6
,对于每个输入药物,将子结构序列
C
进行独热编码形成矩阵
M∈R
k
×
Θ
,其中
k
是药物...

【专利技术属性】
技术研发人员:王兆静成子惠唐贤方朱标杨非
申请(专利权)人:武汉纺织大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1