当前位置: 首页 > 专利查询>深圳大学专利>正文

一种基于多任务学习和深度跨域的药物重定位方法及系统技术方案

技术编号:38234795 阅读:6 留言:0更新日期:2023-07-25 18:01
本发明专利技术涉及计算生物学技术领域,公开了一种基于多任务学习和深度跨域的药物重定位方法及系统,包括以下步骤:S1.收集具有“靶点节点—药物节点—疾病节点”三元关系的数据;S2.将目标域和辅助域数据输入特征提取网络中进行特征提取;S3.分别对目标域和辅助域搭建两层的图注意力神经网络;S4.对增强后的深层次的目标域特征向量和辅助域特征向量进行融合;S5.设置目标域和辅助域的图注意力神经网络的损失函数,对图注意力神经网络进行多任务学习;S6.输出最终预测的药物—疾病关联矩阵,完成药物重定位。本发明专利技术解决了现有技术没有将药物—靶点相互作用的预测和药物—疾病关联预测两项任务统一的问题,且具有准确、鲁棒性强的特点。的特点。的特点。

【技术实现步骤摘要】
overview[J].Journal of Pharmacy and Pharmacology,2020,72(9):1145

1151.
[0009][2]Wong H H,Jessup A,Sertkaya A,et al.Examination of clinical trial costs and barriers for drug development final[J].Office of the Assistant Secretary for Planning and Evaluation,US Department of Health&Human Services,2014.
[0010][3]Pushpakom S,Iorio F,Eyers P A,et al.Drug repurposing:progress
,
challenges and recommendations[J].Nature reviews Drug discovery,2019,18(1):41

58.
[0011][4]Luo Y,Zhao X,Zhou J,et al.A network integration approach for drug—target interaction prediction and computational drug repositioning from heterogeneous information[J].Nature communications,2017,8(1):1—13.
[0012][5]Liu Z,Chen Q,Lan W,et al.GADTI:graph autoencoder approach for DTI prediction from heterogeneous network[J].Frontiers in Genetics,2021,12:650821.
[0013][6]Jarada T N,Rokne J G,Alhajj R.SNF

CVAE:computational method to predict drug

disease interactions using similarity network fusion and collective variational autoencoder[J].Knowledge

Based Systems,2021,212:106585.
[0014][7]Xuan P,Ye Y,Zhang T,Zhao L,Sun C.Convolutional neural network and bidirectional long short—term memory—based method for predicting drug—disease associations.Cell.2019;8(7):705.
[0015][8]Chen H,Cheng F,Li J.iDrug:Integration of drug repositioning and drug—target prediction via cross—network embedding[J].PLoS computational biology,2020,16(7):e1008040.
[0016][9]Zitnik,M.et al.BioSNAP Datasets:Stanford Biomedical Network Dataset Collection.http://snap.stanford.edu/biodata.2018.

技术实现思路

[0017]本专利技术为了解决现有技术没有将药物—靶点相互作用的预测和药物—疾病关联预测两项任务统一的问题,提供了一种引入多任务学习和图神经网络的药物重定位方法及系统,其具有准确、鲁棒性强的特点。
[0018]为实现上述本专利技术目的,采用的技术方案如下:
[0019]一种基于多任务学习和深度跨域的药物重定位方法,包括以下步骤:
[0020]S1.收集具有“靶点节点—药物节点—疾病节点”三元关系的数据并构成数据集;在数据集中,药物节点分别连接疾病节点、靶点节点,构成“药物—靶点”域和“药物—疾病”域;将“药物—疾病”域作为目标域,“药物—靶点”域作为辅助域;在目标域,构建原始的药物相似度矩阵、原始的疾病相似度矩阵,并根据已知的药物、疾病的关联构建药物—疾病关联矩阵;在辅助域,构建原始的药物相似度矩阵、原始的靶点相似度矩阵,并根据已知的药物、靶点的相互作用构建药物—靶点关联矩阵;并构建了目标域药物、疾病节点的K近邻相
似度矩阵及辅助域药物、靶点节点的K近邻相似度矩阵;
[0021]S2.将目标域和辅助域的原始的相似度矩阵输入特征提取网络中进行特征提取;具体为:通过特征提取网络对目标域的原始的药物相似度矩阵、原始的疾病相似度矩阵进行降维,得到目标域特征矩阵;通过特征提取网络对辅助域的原始的药物相似度矩阵、原始的靶点相似度矩阵进行降维得到辅助域特征矩阵;
[0022]S3.根据药物—疾病关联矩阵及目标域药物、疾病节点的K近邻相似度矩阵、药物—靶点关联矩阵及辅助域药物、靶点节点的K近邻相似度矩阵,构建目标域邻接矩阵、辅助域邻接矩阵;根据目标域邻接矩阵、辅助域邻接矩阵,分别对目标域和辅助域搭建两层的图注意力神经网络;将目标域特征矩阵输入目标域的图注意力神经网络,提取深层次的目标域特征向量;将辅助域特征矩阵输入辅助域的图注意力神经网络,提取深层次的辅助域特征向量;
[0023]S4.对深层次的目标域特征向量和辅助域特征向量进行数据增强,利用多头自注意力机制计算权重参数,以加权求和的方式对增强后的深层次的目标域特征向量和辅助域特征向量进行融合,实现深度跨域融合;
[0024]S5.设置目标域和辅助域的图注意力神经网络的损失函数,对图注意力神经网络进行多任务学习,迭代更新图注意力神经网络的参数;
[0025]S6.迭代更新后使用内积解码器对得到的深度跨域融合后的特征向量进行解码,输出最终预测的药物—疾病关联矩阵,完成药物重定位。
[0026]首先的,所述的步骤S1中:
[0027]若收集的数据中包括有原始的药物相似度矩阵、原始的疾病相似度矩阵、原始的靶点相似度矩阵,则直接使用;
[0028]若不含有相似度矩阵,则按照以下方法进行计算:
[0029]根据数据集中药物的化学结构SMILES编码信息,使用Tanimoto相似性计算方法进行计算,构建原始的药物相似度矩阵;
[0030]根据数据集中靶点的蛋白质序列信息,使用Smith—Waterman相似性计算方法进行计算,构建原始的靶点相似度矩阵;
[0031]根据数据集中疾病的语义信息,计算描述疾病的MeSH术语之间的语义本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多任务学习和深度跨域的药物重定位方法,其特征在于:包括以下步骤:S1.收集具有“靶点节点—药物节点—疾病节点”三元关系的数据并构成数据集;在数据集中,药物节点分别连接疾病节点、靶点节点,构成“药物—靶点”域和“药物—疾病”域;将“药物—疾病”域作为目标域,“药物—靶点”域作为辅助域;在目标域,构建原始的药物相似度矩阵、原始的疾病相似度矩阵,并根据已知的药物、疾病的关联构建药物—疾病关联矩阵;在辅助域,构建原始的药物相似度矩阵、原始的靶点相似度矩阵,并根据已知的药物、靶点的相互作用构建药物—靶点关联矩阵;并构建了目标域药物、疾病节点的K近邻相似度矩阵及辅助域药物、靶点节点的K近邻相似度矩阵;S2.将目标域和辅助域的原始的相似度矩阵输入特征提取网络中进行特征提取;具体为:通过特征提取网络对目标域的原始的药物相似度矩阵、原始的疾病相似度矩阵进行降维,得到目标域特征矩阵;通过特征提取网络对辅助域的原始的药物相似度矩阵、原始的靶点相似度矩阵进行降维得到辅助域特征矩阵;S3.根据药物—疾病关联矩阵及目标域药物、疾病节点的K近邻相似度矩阵、药物—靶点关联矩阵及辅助域药物、靶点节点的K近邻相似度矩阵,构建目标域邻接矩阵、辅助域邻接矩阵;根据目标域邻接矩阵、辅助域邻接矩阵,分别对目标域和辅助域搭建两层的图注意力神经网络;将目标域特征矩阵输入目标域的图注意力神经网络,提取深层次的目标域特征向量;将辅助域特征矩阵输入辅助域的图注意力神经网络,提取深层次的辅助域特征向量;S4.对深层次的目标域特征向量和辅助域特征向量进行数据增强,利用多头自注意力机制计算权重参数,以加权求和的方式对增强后的深层次的目标域特征向量和辅助域特征向量进行融合,实现深度跨域融合;S5.设置目标域和辅助域的图注意力神经网络的损失函数,对图注意力神经网络进行多任务学习,迭代更新图注意力神经网络的参数;S6.迭代更新后使用内积解码器对得到的深度跨域融合后的特征向量进行解码,输出最终预测的药物—疾病关联矩阵,完成药物重定位。2.根据权利要求1所述的基于多任务学习和深度跨域的药物重定位方法,其特征在于:所述的步骤S1中:若收集的数据中包括有原始的药物相似度矩阵、原始的疾病相似度矩阵、原始的靶点相似度矩阵,则直接使用;若不含有相似度矩阵,则按照以下方法进行计算:根据数据集中药物的化学结构SMILES编码信息,使用Tanimoto相似性计算方法进行计算,构建原始的药物相似度矩阵;根据数据集中靶点的蛋白质序列信息,使用Smith

Waterman相似性计算方法进行计算,构建原始的靶点相似度矩阵;根据数据集中疾病的语义信息,计算描述疾病的MeSH术语之间的语义相似性,构建原始的疾病相似度矩阵。3.根据权利要求1所述的基于多任务学习和深度跨域的药物重定位方法,其特征在于:所述的步骤S1中,并构建了目标域药物、疾病节点的K近邻相似度矩阵及辅助域药物、靶点节点的K近邻相似度矩阵,具体为:
分别构建目标域的药物、疾病、辅助域药物和靶点的K近邻相似度矩阵计算K邻近相似矩阵S
i

j
的方法如下:其中,N(i)代表节点i的K近邻集合,S
ij
为节点i和节点j的相似度矩阵,i和j为节点序号;所述的步骤S3中,分别根据药物—疾病关联矩阵、目标域药物和疾病节点的K近邻相似度矩阵及药物—靶点关联矩阵、辅助域药物和靶点节点的K近邻相似度矩阵,构建目标域邻接矩阵、辅助域邻接矩阵,得到目标域邻接矩阵Adj1、辅助域邻接矩阵Adj2:其中,Y
D
为药物—疾病关联矩阵,Y
E
为药物—靶点关联矩阵,为药物—靶点关联矩阵,其中m1为目标域药物节点的数量;n1为疾病节点的数量,m2为辅助域药物节点的数量,n2为靶点节点的数量。4.根据权利要求3所述的基于多任务学习和深度跨域的药物重定位方法,其特征在于:所述的步骤S2中,所述的特征提取网络由两层全连接神经网络组成;第一层网络的输入维度为节点原始特征的维度,即相似矩阵的列数,输出维度为512,选用ReLU激活函数进行非线性激活;第二层网络的输入维度为512,输出维度为128;经过特征提取后,分别得到目标域药物、疾病、辅助域药物和靶点的降维之后的特征矩阵征提取后,分别得到目标域药物、疾病、辅助域药物和靶点的降维之后的特征矩阵将(
D
)
MLP
、(
d
)
MLP
作为目标域特征矩阵;(
E
)
MLP
、(
e
)
MLP
作为辅助域特征矩阵。5.根据权利要求4所述的基于多任务学习和深度跨域的药物重定位方法,其特征在于:所述的步骤S3,具体为:设目标域的两层的图注意力神经网络为G1;设辅助域的两层的图注意力神经网络为G2,设置输出的特征维度F
out
,并设置多头注意力的数目N
GAT
,使用elu激活函数进行非线性激活;图网络使用目标域和辅助域邻接矩阵作为图的存储,并将辅助域特征矩阵和目标域特征矩阵作为图神经网络的节点特征输入;图神经网络对节点特征进行更新,分别得到目标域药物和疾病的更深层次的特征矩阵并分别得到辅助域药物和靶点的更深层次的特征矩阵6.根据权利要求5所述的基于多任务学习和深度跨域的药物重定位方法,其特征在于:图神经网络对节点特征进行更新,具体步骤为:S301.使用自注意力机制计算节点i和节点j之间的注意力系数α
ij

其中LeakyReLU为激活函数,||表示拼接操作,W为权重矩阵,a表示参数化的更深层次的特征向量,N(i)表示节点i的邻居节点;S302.根据注意力系数,得到节点...

【专利技术属性】
技术研发人员:欧阳乐董东沛金坚灵吕劲
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1