一种基于群体智能的药物-靶标相互作用预测方法技术

技术编号:23498459 阅读:23 留言:0更新日期:2020-03-13 13:19
本发明专利技术提供一种基于群体智能的药物‑靶标相互作用预测方法,包括以下步骤:步骤1:从数据库获取药物与靶标的数据,分别计算药物相似性、靶标相似性,建立全局药物与靶标相互作用网络;步骤2:采用随机行走的方法,从所述全局药物与靶标相互作用网络中提取用来分类的关键特征,将网络中的药物与靶标相互作用连接权重作为类编号;步骤3:根据相似的药物与相似的靶标绑定的原则,筛选分类的负样本;步骤4:采用极限学习机作为药物‑靶标相互作用分类器;步骤5:采用群体智能算法对极限学习机输入权重进行优化,所述群体智能算法使用全局搜索与局部搜索相结合的方法。本发明专利技术显著提高药物‑靶标相互作用预测的精度。

A prediction method of drug target interaction based on swarm intelligence

【技术实现步骤摘要】
一种基于群体智能的药物-靶标相互作用预测方法
本专利技术涉及生物信息
,尤其涉及网络药理学中的药物-靶标相互作用预测方法,具体涉及一种基于群体智能的药物-靶标相互作用预测方法。
技术介绍
发现新的药物靶标,是药物研发的“重磅性”发现,也是药物研发的源头。传统的以实验的方式发现新的药物,一般需要8-10年的时间,研发的成本高且周期漫长。随着基因组学、蛋白质组学、代谢组学、系统生物学等生物信息学技术的迅速发展,以大数据为依托的,融合机器学习与网络药理学的计算方法得到研究者的关注。关键的问题是如何从已有的数据中发现和识别出新的药物-靶标相互作用关系。关于药物-靶标相互作用预测问题,实际上一直被认为是机器学习中的两类分类问题。一种药物与一种靶标之间有相互作用的属于一类;没有相互作用的属于另外一类。因此,目前流行的机器学习方法是建立两部图分类模型和一部图分类模型。对于两部图分类模型,是分别计算药物的相似性和靶标的相似性矩阵,然后,使用分类器,分别对药物空间和靶标空间进行预测,再用集成的方法进行药物-靶标相互作用预测。而一部图分类模型是直接根据药物和靶标的原始特征进行特征选择,并用分类器进行分类。上述过程是药物-靶标相互作用的典型的预测方法,这些方法存在如下缺点:1)对于两部图分类模型和一部图分类模型,都会随着数据样本的增加或特征的增加,而降低分类器预测的精度。2)药物-靶标相互作用对的负样本的产生比较困难,目前的方法是把药物和靶标没有确定的样本对当做负样本,这使得一些正样本被错误的判断为负样本,从而降低了预测的精度。3)当前的方法所使用的分类器,大部分都对一些重要参数很敏感,而这些参数的选择没有做深度的优化。申请公布号为CN109887540A的中国专利公开了一种基于异构网络嵌入的药物靶标相互作用预测方法,首先使用随机游走的方法,获得关键样本特征,并采纳了神经网络算法及随机森林算法,一定程度上提高了预测的精度。然而,其中算法的参数没有得到优化,其预测精度仍然较低。申请公布号为CN109712678A的中国专利公开了一种关系预测方法、装置及电子设备,该方法重点考虑了药物、靶标及疾病的数据融合,而对分类器的性能及参数优化方面没有大的改进,依然存在分类器参数缺乏优化的问题。申请公布号为CN110021341A的中国专利公开了一种基于异构网络的GPCR药物和靶向通路的预测方法,提出了药物及通路的异构网络,并采纳RBM分类器进行预测。然而,RBM的性能对三个重要参数比较敏感,亟需对其优化。申请公布号为CN109872781A的中国专利公开了基于Xgboost的药物靶点识别方法,该方法重点采纳了成分分析等以提取关键特征,然后使用CART分类器进行预测,然而,CART参数也没有得到优化。
技术实现思路
本专利技术的目的在于提供一种基于群体智能的药物-靶标相互作用预测方法,针对现有技术中分类器预测精度低等问题,本专利技术结合两部图和一部图的优点,提出了基于网络的分类模型;对于负样本的筛选,我们提出了一种自学的负样本选择方法;对于分类器参数敏感的问题,提出了一种群体智能优化的极限学习机,实现分类器参数的智能优化。首先,我们对收集的药物和靶标的原始数据计算并建立其相似性矩阵;对于已经确定的药物-靶标相互作用对表达为1,对未知的药物靶标相互作用表达为0,建立药物靶标相互作用的邻接矩阵(无向图);根据“相似的药物往往更容易与相似的靶标产生相互作用”的原则,修订药物靶标邻接矩阵;对于每个药物节点,搜索其最近的药物与每个靶标的最近靶标的路径,计算路径长度,作为分类器的新的特征;通过网络搜索和计算,建立新的分类模型;然后,根据“相似的药物往往更容易与相似的靶标产生相互作用”的原则,筛选负样本;最后,利用群体智能算法的优势,对极限学习机的网络参数进行优化,以预测精度为适应度函数,进行训练和学习,最后验证了药物靶标相互作用预测的精度,结果发现,本专利技术有效提高预测的精度和速度。本专利技术上述目的通过以下技术方案实现:本专利技术提供一种基于群体智能的药物-靶标相互作用预测方法,包括以下步骤:步骤1:从数据库获取药物与靶标的数据,分别计算药物相似性、靶标相似性,建立全局药物与靶标相互作用网络;步骤2:采用随机行走的方法,从所述全局药物与靶标相互作用网络中提取用来分类的关键特征,将网络中的药物与靶标相互作用连接权重作为类编号;步骤3:根据相似的药物与相似的靶标绑定的原则,筛选分类的负样本;步骤4:采用极限学习机作为药物-靶标相互作用分类器;步骤5:采用群体智能算法对极限学习机输入权重进行优化,所述群体智能算法使用全局搜索与局部搜索相结合的方法。可选地,所述步骤1中,所述数据库可以为KEGG、DrugBank等现有数据库。可选地,所述步骤1中,获取的所述数据包括药物、靶标及已知的药物-靶标相互作用数据。可选地,所述步骤1中,使用SIMCOMP算法计算药物的相似性。可选地,所述步骤1中,使用Smith–Watermanscores算法计算靶标的相似性。可选地,所述步骤1中,所述靶标为蛋白质等。可选地,所述步骤2包括以下步骤:步骤2-1:以任意一个药物节点为起点,计算其k个最近关联的药物节点;同时,在靶标子网络中,以任意一个靶标节点为终点,计算其k个最近关联的靶标节点,在全局网络中,根据邻接矩阵的权重,搜索从药物到靶标的最近路径,求总和,作为网络分类的基本特征;步骤2-2:计算不同搜索路径的总距离,作为分类的不同关键特征:kf表示药物i与药物j相互作用的一个特征,di和dj表示药物基本特征,ti和tj表示靶标基本特征,sim()为药物或靶标的相似性函数,weight()表示药物与靶标的相互作用权重。可选地,所述步骤2-1中,k一般为[3,10]区间的整数。可选地,所述步骤2中,药物与靶标相互作用权重为1,表示正样本的类标号,建立分类模型。可选地,所述步骤3中,筛选分类的负样本时,根据相似的药物更容易与相似的靶标产生相互作用的原则,分别计算药物di与tj的k个最近的邻居的相互作用,计为同样的,计算靶标tj与药物di的k个最近的邻居的相互作用,计为计算总分,排序,排序最低的作为负样本,wi表示药物与靶标相互作用权重,di表示药物与药物的相似性权重,ti表示靶标与靶标的相似性权重。可选地,所述步骤4中,得到基于极限学习机算法的输入层权重wi和偏移量bi矩阵,使用群体智能算法对其优化。可选地,所述步骤5中,所述群体智能算法选自混合蛙跳算法、粒子群算法、进化算法、人工蜜蜂群算法、教与学优化算法的任一种。可选地,所述步骤5中,所述群体智能算法为改进的混合蛙跳算法,具体包括如下步骤:步骤5-1:以极限学习机的输入层权重和偏移对混合蛙跳的每个个体做编码,以极限学习机的预测准确率作为混合蛙跳算法的适应度值,进行搜索;步骤5-2:对于混合蛙跳算法根据适应度值,进行蛙跳子群的划本文档来自技高网
...

【技术保护点】
1.一种基于群体智能的药物-靶标相互作用预测方法,其特征在于,包括以下步骤:/n步骤1:从数据库获取药物与靶标的数据,分别计算药物相似性、靶标相似性,建立全局药物与靶标相互作用网络;/n步骤2:采用随机行走的方法,从所述全局药物与靶标相互作用网络中提取用来分类的关键特征,将网络中的药物与靶标相互作用连接权重作为类编号;/n步骤3:根据相似的药物与相似的靶标绑定的原则,筛选分类的负样本;/n步骤4:采用极限学习机作为药物-靶标相互作用分类器;/n步骤5:采用群体智能算法对极限学习机输入权重进行优化,所述群体智能算法使用全局搜索与局部搜索相结合的方法。/n

【技术特征摘要】
1.一种基于群体智能的药物-靶标相互作用预测方法,其特征在于,包括以下步骤:
步骤1:从数据库获取药物与靶标的数据,分别计算药物相似性、靶标相似性,建立全局药物与靶标相互作用网络;
步骤2:采用随机行走的方法,从所述全局药物与靶标相互作用网络中提取用来分类的关键特征,将网络中的药物与靶标相互作用连接权重作为类编号;
步骤3:根据相似的药物与相似的靶标绑定的原则,筛选分类的负样本;
步骤4:采用极限学习机作为药物-靶标相互作用分类器;
步骤5:采用群体智能算法对极限学习机输入权重进行优化,所述群体智能算法使用全局搜索与局部搜索相结合的方法。


2.根据权利要求1所述的药物-靶标相互作用预测方法,其特征在于:所述步骤1中,使用图排列算法计算药物的相似性,使用Smith–Watermanscores方法计算靶标的相似性。


3.根据权利要求1所述的药物-靶标相互作用预测方法,其特征在于:所述步骤2包括以下步骤:
步骤2-1:以任意一个药物节点为起点,计算其k个最近关联的药物节点;同时,在靶标子网络中,以任意一个靶标节点为终点,计算其k个最近关联的靶标节点,在全局网络中,根据邻接矩阵的权重,搜索从药物到靶标的最近路径,求总和,作为网络分类的基本特征;
步骤2-2:不同的搜索路径,记录总的距离,作为分类的不同关键特征,公式如下:



kf表示药物i与药物j相互作用的一个特征,di和dj表示药物基本特征,ti和tj表示靶标基本特征,sim()为药物或靶标的相似性函数,weight()表示药物与靶标的相互作用权重。


4.根据权利要求1所述的药物-靶标相互作用预测方法,其特征在于:所述步骤2中,药物与靶标相互作用权重为1,表示正样本的类标号,建立分类模型。


5.根据权利要求1所述的药物-靶标相互作用预测方法,其特征在于:所述步骤3中,筛选分类的负样本时,根据相似的药物更容易与相似的靶标产生相互作用的原则,分别计算药物di与靶标tj的k个最近的邻居的相互作用,计为同样的,计算靶标tj与药物di的k个最近的邻居的相互作用,计为计算总分,排序,排序最低的作为负样本,wi表示药物与靶标相互作用权重,di表示药物与药物的相似性权重,ti表示靶标与靶标的相似性权重。


6.根据权利要求1所述的药物-靶标相互作用预测方法,其特征在于:所述步骤4中,随机产生输入层权重w和偏移量b矩阵,计算隐含层输出...

【专利技术属性】
技术研发人员:唐德玉蔡永铭杨进
申请(专利权)人:广东药科大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1