一种基于药物多维相似度的药物交互作用预测方法技术

技术编号:24414394 阅读:107 留言:0更新日期:2020-06-06 10:45
本发明专利技术公开了一种基于药物多维相似度的药物交互作用预测方法,该方法包括:基于药物在化合物分子描述符、药物靶标、ATC编码、通路及靶标在蛋白质交互作用网络中邻居节点多个方面的特性计算两个药物间的多维度相似性;基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器用于区分协同、拮抗、独立的药物交互作用。

A drug interaction prediction method based on multi-dimensional similarity

【技术实现步骤摘要】
一种基于药物多维相似度的药物交互作用预测方法
本专利技术涉及生物信息学领域,特别涉及利用计算机技术预测药物交互作用的领域。
技术介绍
传统药物研发主要针对作用于单一靶标的单一化合物,而复杂疾病往往对应着复杂的生物过程,一对一的药物-靶标作用模式在很多疾病的治疗中无法达到显著疗效。临床发现合理的药物联用不仅可以提高药物疗效,还可以降低毒副作用,为复杂疾病的治疗提供了新方式:组合药物。组合药物由两种或者两种以上活性药物成分组成,不同成分通常作用于不同靶标,调控不同病理过程,以较低的量达到更高疗效并且降低药物毒副作用。目前,组合药物正愈来愈多地用于复杂疾病,如:癌症、艾滋病、高血压、肺结核等疾病的治疗中。不同于随机组合的药物,组合药物的不同药物间存在着协同交互作用。协同交互的药物组合具有有增效减毒的作用,即药物组合产生的药效大于各个药物单独使用时产生的药效的加和。与之对应的另外一种药物交互作用为拮抗交互,拮抗交互的药物组合会降低疗效,增加药物毒副作用。无论拮抗交互还是协同交互,药物间均存在着药理、药代方面的关联关系。针对复杂疾病的治疗,合理设计组合药物,有效地利用协同交互的药物组合同时避免拮抗交互的药物组合,将极大提高疾病的治疗效果。现有的组合药物主要来自于临床经验,而药物组合的情况随着药物个数呈指数级增加,其组合爆炸的问题使得临床或实验研究几乎无法实现。因此,发展有效的计算机预测方法成为组合药物发现研究的必然趋势,通过计算预测出药物组合的类型,能够为实验研究提供指导,有利于组合药物研发工作的推进。目前,已有研究者提出了多种计算方法用于分析药物组合或药物交互作用。其中一种比较常用的方法是基于药物间各种类型的相似性度量构建分类模型。例如,Zou等分析药物靶标在蛋白质交互作用(ProteinProteinInteraction:PPI)网络中的邻近社区的拓扑特性及相关基因本体(GeneOntology:GO)语义相似性,构建SVM分类器,从而对药物组合是否可以作为有效的组合药物进行预测。然而,仅仅通过药物靶标间的特性分析药物组合,会忽略很多药物相关信息。Gottlieb等则考虑了更为全面的药物特性,整合利用药物ATC编码、药物靶标在PPI网络上的距离、靶标的GO术语、靶标序列、化合物结构、药物副作用、配体结构共7个不同方面的药物相似度度量,构建药物交互作用分类模型。但是,现有的分类模型存在一些局限,其一是没有考虑到不同药物在通路方面的关联关系,而有效的组合药物通常是通过干预相关联的通路实现协同增效的作用。其二,这些分类模型主要针对有无交互作用或者是否作为组合药物进行分类,这两种模型均没有对协同交互和拮抗交互进行很好的区分。在分类器的构建方面,针对于高维特征的数据集通常需要先通过特征的降维,再进行分类。2008年,向世明等提出一种马氏距离矩阵的启发式学习方法,学习获得的马氏距离矩阵用于分类和聚类方法中可以有效提高原有方法的精度,这种降维的方法为预测药物交互作用的类别提供有利参考。
技术实现思路
(一)要解决的技术问题本专利技术的目的在于提出一种基于药物多维相似度的药物交互作用预测方法,整合药物多个方面特性计算药物相似性,并构建基于马氏距离的SVM分类器对协同、拮抗以及独立三种类型的药物交互作用进行分类。(二)技术方案为了解决上述技术问题,本专利技术提供了一种基于药物多维相似度的药物交互作用预测包括:一、基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器;步骤1:获取已知药物交互作用类型的药物对;步骤2:计算药物对间的多维度药物相似性;步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;步骤4:基于马氏距离变换的数据,构建三类别药物交互作用的SVM分类器。二、基于上述构建好的SVM分类器预测任意多个候选药物中每两个药物间的相互作用;针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别),即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。所述步骤2包括以下步骤:步骤21:基于药物的分子描述符计算药物相似性;步骤22:基于药物的二维结构计算药物相似性;步骤23:基于药物靶标计算药物相似性;步骤24:基于药物ATC编码计算药物相似性;步骤25:基于药物靶标所在通路计算药物相似性;步骤26:基于药物靶标在蛋白质交互作用网络中邻居节点计算药物相似性;步骤27:整合基于不同特性的药物相似性度量结果获得多维度药物相似性。所述步骤3包括以下步骤:步骤31:构建Must-links矩阵Ls(i,j):其中pairi、pairj表示两对不同的药物交互作用对,(pairi,pairj)∈S表示pairi、pairj两个药物对属于相同的药物交互作用类型。上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为1,否则为0;构建Cannot-links矩阵Ld(i,j):其中(pairi,pairj)∈D表示pairi、pairj两个药物对是属于不同类型的药物交互上述公式的含义表示当药物对pairi与pairj属于相同的药物交互作用类型时,矩阵中第i行、第j列的内容为0,否则为1;步骤32:基于Ls、Ld分别计算协方差矩阵其中X为药物交互作用对特征描述矩阵,每一列对应一个药物交互作用对,每一行对应一种相似性度量结果;步骤33:利用马氏距离学习方法学习马氏距离转换矩阵所述步骤4包括:步骤41:对原始数据进行马氏距离变换处理:X'=W*TX;步骤42:基于马氏距离变换后的数据集,构建针对药物交互作用分类的SVM分类器。(三)有益效果本专利技术提出的一种基于药物多维相似度的药物交互作用预测方法,通过整合药物在分子描述符、二维结构、靶标、ATC编码、通路以及靶标在蛋白质交互作用网络中邻居节点多个方面的相似性度量来全面描述药物间的关联关系,为药物交互作用的分类及机理阐释提供基础;基于马氏距离的SVM分类器可以提高分类器精读,并可靠预测出药物对属于不同类型药物交互作用的概率。附图说明图1是本专利技术的一种基于药物多维相似度的药物交互作用预测方法的示意图;具体实施方式为使本专利技术的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本专利技术作进一步的详细说明。一、基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器;图1是本专利技术所提供本文档来自技高网
...

【技术保护点】
1.一种基于药物多维相似度的药物交互作用预测方法,该方法包括:/n一、基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器;/n步骤1:获取已知药物交互作用类型的药物对;/n步骤2:计算每对药物中不同药物间的多维度相似性;/n步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;/n步骤4:基于马氏距离变换后的数据,构建三类别药物交互作用的SVM分类器;/n二、基于上述构建好的SVM分类器预测任意多个(2个以上)候选药物中每两个药物间的相互作用;/n针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别,即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。/n

【技术特征摘要】
1.一种基于药物多维相似度的药物交互作用预测方法,该方法包括:
一、基于所述多维度药物相似性特征构建基于马氏距离的SVM分类器;
步骤1:获取已知药物交互作用类型的药物对;
步骤2:计算每对药物中不同药物间的多维度相似性;
步骤3:基于多维度药物相似性度量及药物交互作用已知类别学习马氏距离变换矩阵;
步骤4:基于马氏距离变换后的数据,构建三类别药物交互作用的SVM分类器;
二、基于上述构建好的SVM分类器预测任意多个(2个以上)候选药物中每两个药物间的相互作用;
针对多个候选药物中任意两种DrugBank数据库内具有靶标、二维结构及ATC编码信息的药物,基于步骤2相同方法计算两个药物间的多维相似度;基于步骤3已经获得的马氏距离矩阵对多维相似度进行数据变换后带入步骤4内的分类器,获得这两个药物属于每一种药物相互作用类型的概率值,其中三类药物相互作用对应概率值的和为1,且利用概率值最大的药物相互作用类别作为预测获得的药物相互作用类别,即输入的两个药物属于协同、拮抗、独立中一种药物交互作用类型。


2.如权利要求1所述的预测方法,其特征在于:
已知药物交互作用的药物对来源于如下数据库:
-DCDB数据库中药物靶标均已知的协同药物对至少100对;
-从DrugBank数据库中的药物交互作用中随机选取的拮抗药物对至少100对;
-从DrugBank药物中随机产生的不属于DCDB数据库及DrugBank药物交互作用的独立药物对至少100对;
-保证三类药物交互作用数目相等。


3.如权利要求1所述的预测方法,其特征在于,所述步骤2多维度药物相似性计算包括以下步骤:
步骤21:基于药物的分子描述符计算药物相似性;
步骤22:基于药物的二维结构计算药物相似性;
步骤23:基于药物靶标计算药物相似性;
步骤24:基于药物ATC编码计算药物相似性;
步骤25:基于药物靶标所在通路计算药物相似性;
步骤26:基于药物靶标在蛋白质交互作用网络中邻居节点计算药物相似性;
步骤27:整合基于不同特性的药物相似性度量结果获得124维的多维度药物相似性。


4.如权利要求3所述的预测方法,其特征在于,所述步骤21中分子描述符相似性计算如下:



其中,d1、d2代表任意两个药物,MD1d至MDnd表示药物d的n个不同分子描述符。


5.如权利要求3所述的预测方法,其特征在于,所述步骤23包括以下步骤:
步骤231:利用DrugBank数据库获得药物的靶标集合;
步骤232:基于两个药物共享靶标占靶标并集的比例计算药物相似性geneS1;
其中d1、d2代表任意两个药物,Td表示药物d的靶标集合;
步骤233:基于药物靶标的基因本体(GeneOntology:GO)语义相似性计算药物相似性,其中,利用Python的pyGS2包获得药物靶标集合对应的GO集合,并通过pyGS2包计算GO语义相似性,记为geneS2;
步骤234:基于靶标在蛋白质交互作用网络中的最短路径长度计算药物相似性geneS3:
其中,Td1、Td2分布代表药物d1、d2的靶标集合,t1、t2分别为靶标集合中任意一个成员,d(t1,t2)表示靶标t1、t2在PPI网络中的最短路径长度。


6.如权利要求3所述的预测方法,其特征在于,所述步骤25包括以下步骤:
步骤251:利...

【专利技术属性】
技术研发人员:陈迪朴海龙
申请(专利权)人:中国科学院大连化学物理研究所
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1