当前位置: 首页 > 专利查询>天津大学专利>正文

基于多标签学习的多器官药物性病理分析方法技术

技术编号:32667592 阅读:14 留言:0更新日期:2022-03-17 11:20
本发明专利技术公开了一种基于多标签学习的预测多器官药物性病理分析方法,步骤1、使用来自公开数据集TG

【技术实现步骤摘要】
基于多标签学习的多器官药物性病理分析方法


[0001]本专利技术属于生物信息
,具体涉及一种基于深度学习的预测多器官药物性病理的方法。

技术介绍

[0002]药物性毒性是指药物对人体的不良作用,即各种化学物质相互作用引起的机体功能障碍和组织损伤。在药物开发领域,研究人员通过对有关药物开发成本的统计数据的系统审查,发现企业需要花费10到15年和数百万美元将新药推向市场,然而,新候选药物的失败率仍然相当高,其不良反应和毒性作用是临床试验失败和撤柜的主要原因之一。因此,有必要在药物开发项目的早期阶段识别药物性毒性,并尽快消除有毒的化合物,这不仅有利于提高候选药物的成功率,还有利于进一步提高预测模型的性能,改善药物性毒性的研究现状。
[0003]目前,已有很多研究者利用机器学习等技术在药物性毒性预测领域进行研究。例如,Zhu等人在论文“In silico prediction of drug

induced liver injury based on adverse drug reaction reports”中,使用三种描述符构建了预测药物性肝损伤(DILI)的随机森林模型,并分别结合欠采样和过采样的方法,能够在较多情况下完成正确分类。Minowa等人的论文“Toxicogenomic multigene biomarker for predicting the future onset ofproximal tubular injury in rats”中,提出了一种基于基因表达谱来预测大鼠的药物诱导的近端小管损伤的模型。Yu Ri An等人的论文“Construction of a predictive model for evaluating multiple organ toxicity”中,采用ANN、KNN、LDA和SVM算法开发了四种预测模型对药物是否具有肝毒性或肝肾毒性进行分类,预测准确率分别达到96.76%,98.61%,97.22%和93.06%。
[0004]尽管上述研究取得了较好的分类效果,但是仍然有局限性。药物性毒性包含了多种具体的病理表现,预测是一项多标签学习任务,以往的研究大多只关注于预测单一器官毒性有无的二分类问题,或在处理多标签问题时,对每个标签分别构建分类模型,忽略了药物同时引起多种毒性作用的事实,割裂了不同病理之间的内在关系。Kim J等人的论文“An integrative model of multi

organ drug

induced toxicity prediction using gene

expression data”则在不同器官的多种病理表现分类的过程中考虑了病理之间的关系,通过利用基因表达数据,提取训练样本中各病理之间的共现关系,提出了一个预测肝脏和肾脏器官上多种病理的集成模型。集成模型为每个病理建立一个KNN分类器,提取病理关系,并计算评估模型性能的分数。
[0005]但现阶段,生物信息
的多标签分类模型多是基于传统的机器学习算法。最近,深度学习在广泛的领域中的表现令人印象深刻,Yang等人的论文“Deep learning with a rethinking structure for multi

label classification”中,提出了一种基于RNN的RethinkNet模型来解决多标签分类问题。该框架通过交叉验证对十几组多标签数据集进行了评估,证明了RethinkNet在多标签分类任务中获得较高的性能。因此,研究出一种
基于深度学习的预测多器官药物性病理的方法具有重要意义。

技术实现思路

[0006]本专利技术旨在提出一种基于多标签学习的多器官药物性病理分析方法,首次提出了一种新的多标签学习模型Att

RethinkNet,利用该模型运用基因表达数据和毒性信息实现了药物性毒性作用于肝脏和肾脏器官的病理结果的预测分析,以及通过交叉验证评估模型的性能。
[0007]本专利技术利用以下技术方案实现:
[0008]一种基于多标签学习的预测多器官药物性病理分析方法,其特征在于,该方法具体包括以下步骤:
[0009]步骤1、使用来自公开数据集TG

GATEs的数据库基因表达数据G、药物的病理信息T和平衡后的基因表达数据D构建数据集;
[0010]步骤2、进行数据预处理;
[0011]步骤3,构建基于深度学习的多器官药物性病理预测分析网络模型Att

RethinkNet,所述多器官药物性病理预测分析网络模型包括注意力模型、卷积神经网络模型以及深度神经网络,具体包括以下处理:
[0012]步骤3

1、构建注意力模型(attention model):
[0013]所述注意力模型包括多个Keras层、两个Permute层、Dense层、Activation层和Multiply层;第一个Permute层置换输入置换时间步长和每一批的输入大小;然后,在Dense层和Activation层计算输入向量的注意力的概率;其中,Activation层对被激活的神经元使用softmax激活函数;第二个Permute层置换已计算权值的数据的第一个和第二个维数,使元素在Multiply层中的位置相互对应;在Multiply层中,实现特征向量的权值分配;
[0014]步骤3

2、构建卷积神经网络模型:
[0015]所述卷积神经网络模型包括由RNN层和Dense层,其中Dense层将上一层RNN的输出转换为标签向量,生成最终的预测结果;RNN层用于模仿人类反复思考的过程,即是一个迭代优化预测结果的动作,RNN层中使用长短期记忆网络,对每个循环时间步长进行所有预测;RNN层使用LSTM网络,LSTM层中设置recurrent_dropout函数的参数为0.5,激活函数为sigmoid,Dense层的激活函数选择的是sigmoid函数;
[0016]步骤3

3、构建深度神经网络模型:
[0017]利用注意力模型和卷积神经网络模型构成基于深度学习的多器官药物性病理预测分析网络模型Att

RethinkNet模型;实现了深度神经网络的Input层和RNN层之间的注意力机制。
[0018]步骤4,训练基于深度学习的多器官药物性病理预测分析网络模型并评价,具体包括以下步骤:
[0019]步骤4

l、训练分类模型:用步骤3得到的基于深度学习的多器官药物性病理预测分析网络模型进行具体病理预测分类,预测分析每种药物作用于特定的器官所诱导出得不同病理现象,将预处理后的基因表达数据集D输入到深度网络中,对不同器官上的数据进行药物病理预测分析;
[0020]步骤4

2、根据K折交叉验证确定训练集以及测试集;本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多标签学习的预测多器官药物性病理分析方法,其特征在于,该方法具体包括以下步骤:步骤1、使用来自公开数据集TG

GATEs的数据库基因表达数据G、药物的病理信息T和平衡后的基因表达数据D构建数据集;步骤2、进行数据预处理;步骤3,构建基于深度学习的多器官药物性病理预测分析网络模型Att

RethinkNet,所述多器官药物性病理预测分析网络模型包括注意力模型、卷积神经网络模型以及深度神经网络,具体包括以下处理:步骤3

1、构建注意力模型(attention model):所述注意力模型包括多个Keras层、两个Permute层、Dense层、Activation层和Multiply层;第一个Permute层置换输入置换时间步长和每一批的输入大小;然后,在Dense层和Activation层计算输入向量的注意力的概率;其中,Activation层对被激活的神经元使用softmax激活函数;第二个Permute层置换已计算权值的数据的第一个和第二个维数,使元素在Multiply层中的位置相互对应;在Multiply层中,实现特征向量的权值分配;步骤3

2、构建卷积神经网络模型:所述卷积神经网络模型包括由RNN层和Dense层,其中Dense层将上一层RNN的输出转换为标签向量,生成最终的预测结果;RNN层用于模仿人类反复思考的过程,即是一个迭代优化预测结果的动作,RNN层中使用长短期记忆网络,对每个循环时间步长进行所有预测;RNN层使用LSTM网络,LSTM层中设置recurrent_dropout函数的参数为0.5,激活函数为sigmoid,Dense层的激活函数选择的是sigmoid函数;步骤3

3、构建深度神经网络模型:利用注意力模型和卷积神经网络模型构成基于深度学习的多器官药物性病理预测分析网络模型Att

RethinkNet模型;实现了深度神经网络的Input层和RNN层之间的注意力机制。步骤4,训练基于深度学习的多器官药物性病理预测分析网络模型并评价,具体包括以下步骤:步骤4

1、训练分类模型:用步骤3得到的基于深度学习的多器官药物性病理预测分析网络模型进行具体病理预测分类,预测分析每种药物作用于特定的器官所诱导出得不同病理现象,将预处理后的基因表达数据集D输入到深度网络中,对不同器官上的数据进行药物病理预测分析;步骤4
‑<...

【专利技术属性】
技术研发人员:苏苒杨海棠
申请(专利权)人:天津大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1