基于知识图谱的药物靶标作用深度学习预测系统、计算机设备、存储介质技术方案

技术编号:27839714 阅读:17 留言:0更新日期:2021-03-30 12:20
基于知识图谱的药物靶标作用深度学习预测系统、计算机设备、存储介质。本发明专利技术公开了一种基于知识图谱的药物靶标作用深度学习预测系统,属于药物靶标相互作用预测领域。该系统包括KG

【技术实现步骤摘要】
基于知识图谱的药物靶标作用深度学习预测系统、计算机设备、存储介质


[0001]本专利技术涉及药物研发领域,特别涉及一种基于知识图谱的药物靶标作用深度学习预测系统。

技术介绍

[0002]传统的新药研发投资大、周期长、风险高。据报道,研发一种FDA批准的新药大约需要花费26亿美元,平均耗费10~12年的时间。然而经过一系列试验,最终成功上市的机率很低。已经获得批准的药物具有安全性的优点,药物重定位的目的是通过预测药物靶标相互作用来挖掘已经获得批准的药物的潜在临床应用价值。
[0003]目前,已经有很多计算机方法用于药物靶标相互作用预测,最常用的技术可以归为以下三种:基于配体预测药物靶标相互作用模型、基于分子结构预测药物靶标相互作用模型和基于信息网络预测药物靶标相互作用模型。通过计算机辅助药物研发,不仅可以大大的缩短药物研发周期,更能节约药物研发的成本,降低药物研发的风险。

技术实现思路

[0004]本专利技术实施例提供了一种基于知识图谱的药物靶标作用深度学习预测系统、计算机设备、存储介质。为了对披露的实施例的一些方面有一个基础的理解,下面给出了简单的概括。该概括部分不是泛泛评述,也不是要确定关键/重要组成元素或描绘这些实施例的保护范围。其唯一目的是用简单的形式呈现一些概念,以此作为后面的详细说明的序言。
[0005]根据本专利技术实施例的第一方面,提供了一种基于知识图谱的药物靶标深度学习预测系统。
[0006]在一些可选实施例中,所述系统包括KG

DTI模型,所述KG

DTI模型包括药物靶标知识图谱的构建、知识图谱的嵌入表达、药物靶标特征的提取以及药物靶标相互作用的预测;首先,处理药物靶标数据,构建药物靶标知识图谱;其次,通过对知识图谱的嵌入表达得到药物、靶标实体的向量表示;然后利用卷积神经网络提取药物

靶标的特征;最后,将卷积神经网络提取的药物

靶标特征输入到全连接神经网络进行回归和分类并预测药物

靶标相互作用的概率。
[0007]可选地,所述构建药物靶标知识图谱步骤,具体包括提取药物靶标的标识符,已知药物靶标之间存在相互作用表示为”Drug X has Target Y”,并通过已知相互作用的药物靶标对构建知识图谱。
[0008]可选地,所述通过对药物靶标知识图谱嵌入表达,得到药物靶标数据的向量表示,具体实现步骤包括将生成的药物

靶标知识图谱作为输入,通过知识图谱的嵌入表达得到药物靶标实体的向量表示,药物靶标知识图谱所采用的嵌入表达方式为DistMult。DistMult是一种双线性模型,它主要通过基于实体间关系的双线性变换来刻画实体在关系下的语义相关性。模型不仅形式简单、易于计算,而且还能够有效刻画实体间的协同性。提
取到的药物靶标实体的向量维度都是200维。
[0009]可选地,所述区域利用卷积神经网络提取药物

靶标特征,还包括,首先将药物靶标向量拼接在一起,拼接后的输入向量维度为400,然后输入到卷积神经网络并提取药物靶标的特征。这里的卷积神经网络类似于Inception模型,有两个通路,这两个通路有相同的一维卷积神经网络结构,命名为Conv

Conv,每一个通路的Conv结构中都有一维卷积神经网络、批归一化、最大池化层以及为了避免过拟合设置的dropout层。
[0010]可选地,所述区域药物靶标相互作用的预测,还包括将卷积神经网络提取到的特征作为输入,通过全连接层神经网络预测药物靶标之间的相互作用关系,得到药物靶标之间的预测分数。并通过设置阈值的方式,对药物靶标相互作用关系进行二分类,在这里所选用的阈值时0.5,大于阈值,标签设置为1,小于阈值标签设置为0。在对预测结果进行二分类后,定义模型的评价指标,计算模型的准确率、ROC曲线下的面积AUC,召回率等,并通过这些指标来设置模型的参数。通过反向传播的方式更新模型中的参数。使用二元交叉熵作为模型的损失函数,学习率设置为1e

3,并使用Adagrad作为优化器优化模型,同时batch_size设置为64,迭代次数设置为300。
[0011]根据本专利技术实施例的第二方面,提供一种计算机设备。
[0012]在一些可选实施例中,所述计算机设备包括:存储器、处理器及存储在所述存储器上并可被所述处理器运行的程序,所述处理器执行所述程序时实现以下步骤:药物靶标知识图谱的构建、知识图谱的嵌入表达、药物靶标特征的提取以及药物靶标相互作用的预测;首先,处理药物靶标数据,构建药物靶标知识图谱;其次,通过对知识图谱的嵌入表达得到药物、靶标实体的向量表示;然后利用卷积神经网络提取药物

靶标的特征;最后,将卷积神经网络提取的药物

靶标特征输入到全连接神经网络进行回归和分类并预测药物

靶标相互作用的概率。
[0013]可选地,所述构建药物靶标知识图谱步骤,具体包括提取药物靶标的标识符,已知药物靶标之间存在相互作用表示为”Drug X has Target Y”,并通过已知相互作用的药物靶标对构建知识图谱。
[0014]可选地,所述通过对药物靶标知识图谱嵌入表达,得到药物靶标数据的向量表示,具体实现步骤包括将生成的药物

靶标知识图谱作为输入,通过知识图谱的嵌入表达得到药物靶标实体的向量表示,药物靶标知识图谱所采用的嵌入表达方式为DistMult。DistMult是一种双线性模型,它主要通过基于实体间关系的双线性变换来刻画实体在关系下的语义相关性。模型不仅形式简单、易于计算,而且还能够有效刻画实体间的协同性。提取到的药物靶标实体的向量维度都是200维。
[0015]可选地,所述区域利用卷积神经网络提取药物

靶标特征,还包括,首先将药物靶标向量拼接在一起,拼接后的输入向量维度为400,然后输入到卷积神经网络并提取药物靶标的特征。这里的卷积神经网络类似于Inception模型,有两个通路,这两个通路有相同的一维卷积神经网络结构,命名为Conv

Conv,每一个通路的Conv结构中都有一维卷积神经网络、批归一化、最大池化层以及为了避免过拟合设置的dropout层。
[0016]可选地,所述区域药物靶标相互作用的预测,还包括将卷积神经网络提取到的特征作为输入,通过全连接层神经网络预测药物靶标之间的相互作用关系,得到药物靶标之间的预测分数。并通过设置阈值的方式,对药物靶标相互作用关系进行二分类,在这里所选
用的阈值时0.5,大于阈值,标签设置为1,小于阈值标签设置为0。在对预测结果进行二分类后,定义模型的评价指标,计算模型的准确率、ROC曲线下的面积AUC,召回率等,并通过这些指标来设置模型的参数。通过反向传播的方式更新模型中的参数。使用二元交叉熵作为模型的损失函数,学习率设置为1e

3,并使用A本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的药物靶标作用深度学习预测系统包括四部分:药物靶标知识图谱的构建、药物靶标知识图谱的嵌入表达、药物靶标知识图谱的特征提取、药物靶标相互作用的预测。2.如权利要求1所述的系统,其特征在于,所述系统总体流程包括:首先,处理药物靶标数据,构建药物靶标知识图谱;其次,通过对药物靶标知识图谱的嵌入表达得到药物、靶标实体的向量表示;然后利用卷积神经网络提取药物

靶标的特征;最后,将卷积神经网络提取的药物

靶标特征输入到全连接神经网络进行回归和分类并预测药物

靶标相互作用的概率。3.如权利要求2所述的系统,其特征在于,所述区域处理药物靶标数据,构建药物靶标知识图谱的步骤具体包括:提取药物靶标的标识符,已知药物靶标之间存在相互作用表示为”Drug X has Target Y”,并通过已知相互作用的药物靶标对构建知识图谱。4.如权利要求2所述的系统,其特征在于,所述区域通过对药物靶标知识图谱嵌入表达,得到药物靶标数据的向量表示,具体实现步骤包括将生成的药物

靶标知识图谱作为输入,通过知识图谱的嵌入表达得到药物靶标实体的向量表示,药物靶标知识图谱所采用的嵌入表达方式为DistMult,提取到的药物靶标实体的向量维度都是200维。5.如权利要求2所述的系统,其特征在于,所述区域利用卷积神经网络提取药物

靶标特征,还包括,首先将药物靶标向量拼接在一起,拼接后的输入向量维度为400,然后输入到卷积神经网络并提取药物靶标的特征。这里的卷积神经网络类似于Inception模型,有两个通路,这两个通路有相同的一维卷积神经网络结构,命名为Conv

Conv,每一个通路的Conv结构中都有一维卷积神经网络、批归一化、最大池化层以及为了避免过拟合设置的dropout层。6.如权利要求1所述的系统,其特征在于,所述区域药物靶标相互作用...

【专利技术属性】
技术研发人员:王淑栋杜珍珍刘大岩刘嘉丽钟悦田庆雨
申请(专利权)人:中国石油大学华东
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1