当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于先验知识和网络拓扑特性的关键蛋白预测方法技术

技术编号:8366870 阅读:192 留言:0更新日期:2013-02-28 05:45
本发明专利技术公开了一种基于先验知识和网络拓扑特性的关键蛋白预测方法。基于对已知关键蛋白之间拓扑关系的分析发现关键蛋白之间联系紧密,将边聚集系数作为评估两个关键蛋白紧密程度的参数,并利用部分已知关键蛋白,以及其邻居节点与这些已知关键蛋白之间的共簇系数来预测新的关键蛋白。本发明专利技术实现简单,只需根据PPI信息和部分已知关键蛋白信息就能够较准确地预测未知关键蛋白,既能用于非加权PPI网络,也能用于加权PPI网络,解决了化学实验方法成本昂贵、耗时等问题。

【技术实现步骤摘要】

本专利技术涉及基于网络水平的关键蛋白预测领域,特别是一种基于部分已知关键蛋白和生物网络拓扑特性预测新关键蛋白的方法。
技术介绍
蛋白质是构成一切细胞和组织结构必不可少的成分,它是生理功能的执行者,也是生命现象的体现者。不同的蛋白执行不同的生理功能。其中,存在一部分蛋白,通过基因剔除式突变将其移除后会造成有关蛋白质复合物功能丧失,并导致生物体无法生存,这类蛋白被称为关键蛋白。有效的预测关键蛋白对研究细胞的生长调控过程具有重要意义,对病原生物学的研究以及药物设计同样也具有重要价值。在生物学领域,一般利用基因敲除、RNA干扰等实验方法,通过观察生物体是否能 正常生存来辨别一个蛋白是否是关键的。依靠生物实验预测关键蛋白的方法虽然准确有效,但是成本高且效率低。近年来,随着酵母双杂交、串联亲和纯化、质谱分析等高通量的蛋白组技术的发展,可获得的蛋白相互作用(protein-protein interaction, PPI)数据越来越多,为从网络水平上预测关键蛋白提供了条件。研究表明,一个蛋白的关键性与它在生物网络中所对应节点的拓扑特性密切相关。Jeong等人在2001年Nature上发表的文章中提出“中心性-致死性”法则(centrality-lethality rule),该法则表明一个蛋白参与的相互作用越多,这个蛋白对细胞的生存也就越重要。近年来,出现了一系列网络中心性预测方法,典型的中心性测度有度中心性(degree centrality, DC),介数中心性(betweenness centrality, BC),接近度中心性(closeness centrality, CC),子图中心性(subgraph centrality, SC),特征向量中心性(eigenvector centrality, EC)和信息中心性(information centrality, IC)等。节点的度中心性DC定义为网络中与该节点直接相连节点的个数。节点的介数中心性BC表示网络中所有最短路径中经过该节点的数目占所有最短路径数的比例。节点的接近度中心性CC为反比于该节点到网络中其它所有节点的最短路径之和。节点的子图中心性SC是该节点参与网络闭合回路的总数。节点的特征向量中心性EC被定义为网络邻接矩阵的主特征向量该节点的分量。节点的信息中心性IC是测量以该节点为端点的路径的调和平均长度。除了这六种经典的中心性测度,还有一些基于其他拓扑特性的预测关键蛋白质的方法,比如瓶颈(Bottle Neck, BN)和最大稠密邻居子图(Density ofMaximumNeighborhood Component, DMNC)等。瓶颈法将网络中所有节点分别作为根节点建立最短路径树集合。对于以节点V为根节点的最短路径树Tv,定义Tv中节点w的权重为其子孙节点的个数,若节点w的权重小于等于η/4(η是Tv的节点数目),则w节点被定义为瓶颈节点。BN(w)为节点w作为瓶颈节点出现在最短路径树集合中的次数。最大稠密邻居子图针对每个节点u的邻居节点构建邻居子网络N(u),DMNC(u)为EN%其中E为子网络N(U)中边的条数,N为节点的个数,调和系数e —般设定为I. 7。已有大量研究表明,任何一种中心性测度的预测结果都远远好于随机选择的结果,这说明蛋白的关键性与其对应节点的拓扑中心性存在较为显著的相关性。虽然对基于PPI网络拓扑特性的关键蛋白预测方法的研究已经有了较大进展,但是预测的准确度依然存在很大的提升空间。考虑到目前每个物种都存在一定数量的已知关键蛋白,例如DEG数据库搜集了多个物种的关键蛋白信息,如表I所示,是否可以利用部分已知的关键蛋白和PPI网络的拓扑特性进一步提高关键蛋白预测的准确性是一项非常有意义的探索。表IDEG数据库中一些物种的已知关键蛋白数目Organism(Prokaryotes)Essential genes Organism(Eukaryotes)Essential genesAcinetobacter baylyi ADPl499Arabidopsis thaliana356 Bacillus subtilis168Aspergillus fumigatus 35Escherichia coli MG1655712Caenorhabditis elegans 294Francisella novicida U112392Danio rerio288Haemophilus influenzae Rd KW20 642Drosophila melanogaster 339Helicobacter pylori26695323Homo sapiens118Mycobacterium tuberculosis H37Rv 614Mus musculus2114Mycoplasma genitalium G37381Saccharomyces cerevisiae 1110
技术实现思路
本专利技术所要解决的技术问题是,针对现有技术不足,提供一种实现简单的基于先验知识和网络拓扑特性的关键蛋白预测方法,利用部分已知关键蛋白信息,通过评估其他蛋白与这些已知关键蛋白在拓扑上的密切程度来预测其他蛋白的关键性,解决化学实验方法成本昂贵和耗时等问题,提高关键蛋白预测准确度。为解决上述技术问题,本专利技术所采用的技术方案是,只需根据PPI信息和部分已知关键蛋白信息就能够较准确地预测未知关键蛋白,既能用于非加权PPI网络,也能用于加权PPI网络,该方法的步骤为I)输入蛋白相互作用/[目息,用k表不已知的关键蛋白节点,η表不PPI网络中关键蛋白的数量(k个已知关键蛋白加上预测出来的关键蛋白);2)根据蛋白相互作用信息构建无向图G :输入一组蛋白相互作用信息,过滤其中重复的相互作用和自相互作用,构建无向图G;其中G=(V,E),V代表蛋白节点集合,E代表蛋白相互作用集合;3)生成初始的关键蛋白候选集合Nk :用候选关键节点集合P存储预测的关键蛋白质,初始化所述关键节点集合P为空集;用集合K存储k个已知的关键蛋白,关键蛋白候选集合Nk = Nv n (V-K), V e K ;NV为节点v的所有邻居节点的集合;4)计算共簇系数并以此扩展所述候选关键节点集合P :若所述关键蛋白候选集合Nk为非空集,分别计算所述关键蛋白候选集合Nk中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点V,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合Nk ;若所述关键蛋白候选集合Nk为空集,分别计算集合V-K中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点U,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合Nk ;5)判断|P是否等于(n-k),则是,进入步骤6),若否,返回步骤4),其中|P表示扩展后的候选关键节点集合P中的元素个数;6)输出扩展后的候选关键节点集合P中的所有节点。 与现有技术相比,本专利技术所具有的有益效果为本专利技术在考虑蛋白相互作用网络的拓扑特性的基础上,以k个已知的关键蛋白作为种子节点,以该集合中每个节点的邻居节点与集合K的共簇系数作为判断条件不断扩充候选关键蛋白节点集合,直至得到给定预测个本文档来自技高网
...

【技术保护点】
一种基于先验知识和网络拓扑特性的关键蛋白预测方法,其特征在于,该方法的步骤为:?1)输入蛋白相互作用信息,用k表示已知的关键蛋白节点数,n表示蛋白相互作用信息网络中关键蛋白的数量,即k个已知关键蛋白加上预测出来的关键蛋白;?2)根据蛋白相互作用信息构建无向图G:输入一组蛋白相互作用信息,过滤其中重复的相互作用和自相互作用,构建无向图G;其中G=(V,E),V代表蛋白节点集合,E代表蛋白相互作用集合;?3)生成初始的关键蛋白候选集合NK:用候选关键节点集合P存储预测的关键蛋白质,初始化所述关键节点集合P为空集;用集合K存储k个已知的关键蛋白,关键蛋白候选集合NK=Nv∩(V?K),v∈K;Nv为节点v的所有邻居节点的集合;?4)计算共簇系数并以此扩展所述候选关键节点集合P:若所述关键蛋白候选集合NK为非空集,分别计算所述关键蛋白候选集合NK中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点v,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合NK;若所述关键蛋白候选集合NK为空集,分别计算集合V?K中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点u,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合NK;?5)判断|P|是否等于(n?k),则是,进入步骤6),若否,返回步骤4),其中|P|表示扩展后的候选关键节点集合P中的元素个数;?6)输出扩展后的候选关键节点集合P中的所有节点。...

【技术特征摘要】

【专利技术属性】
技术研发人员:李敏张含会王建新
申请(专利权)人:中南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1