当前位置: 首页 > 专利查询>扬州大学专利>正文

基于动态加权相互作用网络中关键蛋白质识别方法技术

技术编号:20972465 阅读:25 留言:0更新日期:2019-04-29 17:48
基于动态加权相互作用网络中关键蛋白质识别方法使用准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络,然后,根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络。在建立好的动态加权PPI网络上,根据蛋白质网络的拓扑特性和生物属性,计算相互作用蛋白质对间的边缘聚类系数、基因本体相似度和皮尔逊相关系数。之后,得到一个重要性分数,最终按分值由大到小排列,输出分值对应的k个蛋白质即为最后结果。本发明专利技术提高了关键蛋白质识别的效率,扩展了该技术在生物信息领域的应用范围和实用性。

Key Protein Recognition Method Based on Dynamic Weighted Interaction Network

Based on the criterion of key protein recognition method in dynamic weighted interaction network, the time point of protein activity and the probability of protein activity are calculated, and the dynamic PPI network is constructed. Then, according to the probability of protein activity, the weight of protein interaction is calculated, and the dynamic weighted PPI network is constructed. In the established dynamic weighted PPI network, the edge clustering coefficients, gene ontology similarity and Pearson correlation coefficients between protein pairs are calculated according to the topological characteristics and biological properties of the protein network. After that, we get an important score, which is arranged from big to small. The output of K proteins corresponding to the score is the final result. The invention improves the efficiency of key protein recognition and expands the application scope and practicability of the technology in the field of bioinformatics.

【技术实现步骤摘要】
基于动态加权相互作用网络中关键蛋白质识别方法
本专利技术属于生物信息
,主要是在蛋白质相互作用网络中通过动态加权相互作用网络识别关键蛋白质的技术,特别涉及在动态加权PPI网络中通过网络拓扑特性和蛋白质生物属性识别关键蛋白质的方法。
技术介绍
在生物细胞中,关键蛋白质是实现细胞功能不可缺少的,关键蛋白质的探测有助于理解细胞代谢,生长和发育的规律。因此,关于关键蛋白质的识别成为蛋白质组学领域的一项重要研究工作之一。虽然目前对于蛋白质相互作用网络中的关键蛋白质的识别取得了一些成果,但由于生命系统的高度复杂性和随机性,其他领域中卓有成效的方法往往在PPI网络分析中不一定取得理想的效果,忽略了蛋白质相互作用网络的动态性,导致识别出来的蛋白质准确率较低。在本专利技术作出之前,在已有的方法中,关键蛋白质识别方法都是根据PPI中的某一顶点的某种重要性指标,如顶点的各种中心度等来排序,取其中较大的k个作为关键蛋白质。然而,这类重要性指标往往很多,如度的中心度、介度中心度、聚类中心度等,这样识别关键蛋白质的缺点是:(1)对于某一蛋白质而言,其某种中心度较高,而其他中心度未必也很高,这将导致识别的关键蛋白质精确度低;(2)基于蛋白质拓扑特性的关键蛋白质预测方法,不但依赖于蛋白质相互作用网络的准确性,同时缺乏考虑关键蛋白质的生物特性。(3)仅仅考虑了静态PPI网络下蛋白质的一些特性,忽略了蛋白质相互作用网络随着时间不断发生变化的。
技术实现思路
本专利技术的目的就在于克服上述缺陷,研制基于动态加权相互作用网络中关键蛋白质识别方法。基于动态加权相互作用网络中关键蛋白质识别方法使用3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络,然后,根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络。在建立好的动态加权PPI网络上,根据蛋白质网络的拓扑特性和生物属性,计算相互作用蛋白质对间的边缘聚类系数、基因本体相似度和皮尔逊相关系数。之后,得到一个重要性分数,最终按分值由大到小排列,输出分值对应的k个蛋白质即为最后结果。基于动态加权相互作用网络中关键蛋白质识别方法,其主要技术特征在于如下步骤:(1)输入PPI网络和基因表达数据;(2)根据3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络;(3)根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络;(4)根据蛋白质顶点之间的相互作用关系,计算边缘聚类系数;(5)根据蛋白质的生物特性,计算相互作用蛋白质对的基因本体(GeneOntology)相似度、皮尔逊相关系数(Personcorrelationcoefficient);(6)根据蛋白质顶点间的权重值、基因本体相似度和皮尔逊相关系数计算蛋白质顶点重要性分数;(7)获得每个顶点的重要性分数并由大到小排序,排序后最大的k个值为关键蛋白质。进一步地,所述步骤(2)根据3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络:通过步骤(1)输入PPI网络和基因表达数据,每个蛋白质具有m个时间点,每个时间点对应了一个基因表达值,根据基因表达值的平均值和标准差,计算活动阈值。将活动阈值与每个蛋白质的基因表达值进行比较,构建动态PPI网络。进一步地,所述步骤(3)根据蛋白质活动概率,计算蛋白质间相互作用权重,构建加权动态PPI网络:通过步骤(2)计算蛋白质活动概率,为每对活动的相互作用蛋白质赋予一个权重,结合动态PPI网络,构建动态加权PPI网络。进一步地,所述步骤(6)根据蛋白质顶点间的权重值、基因本体相似度和皮尔逊相关系数计算蛋白质顶点重要性分数:整合相互作用蛋白质网络的拓扑特性以及蛋白质的生物属性,建立一个蛋白质重要性计算公式,得出每个蛋白质的最终得分。本专利技术的优点和效果在于该方法考虑了蛋白质网络的动态性,整合了蛋白质相互作用网络的拓扑特性以及蛋白质的生物属性信息,进而克服数据的不完全性、动态性以及数据的噪声性所带来的负面影响。在动态加权PPI网络上,将蛋白质相互作用网络的拓扑特性与蛋白质生物属性相结合有助于提高识别关键蛋白质的准确性,提高了关键蛋白质识别的效率,扩展了该技术在生物信息领域的应用范围和实用性。附图说明图1——本专利技术在动态加权相互作用网络中关键蛋白质识别方法流程示意图;图2——本方法(IEP-DPPI)和其他方法在静态PPI网络和动态PPI网络中识别的关键蛋白质数量比较图。具体实施方式本专利技术的技术思路是:根据静态PPI网络和基因表达数据,通过3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络,然后,根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络。基于动态加权PPI网络,根据蛋白质顶点之间的相互作用关系,计算边缘聚类系数;根据蛋白质的生物特性,计算相互作用蛋白质对的基因本体(GeneOntology)相似度、皮尔逊相关系数(Personcorrelationcoefficient)。最后,根据蛋白质顶点间的权重值、基因本体相似度和皮尔逊相关系数计算蛋白质顶点重要性分数,最终获得每个顶点的重要性分数并由大到小排序,排序后最大的k个值为关键蛋白质。在动态加权PPI网络中,整合生物属性和拓扑特性有助于理解未知蛋白质的功能,对于解释特定功能的分子机制有着重要意义,同时能够对药物靶细胞设计等提供重要的理论依据。所以基于动态加权相互作用网络中关键蛋白质识别方法很自然地适用于关键蛋白质的探测。下面结合附图和具体实施方式对本专利技术进行详细说明。步骤1:输入静态PPI网络和基因表达数据步骤2:根据3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络基因表达数据通常由m个时间点表达谱组成。设Gei(p)表示为在时间点i基因p的基因表达值。设u(p)和σ(p)分别表示基因表达数据的算术平均值和标准差。设X是正态分布的实数随机变量N(u,σ2)。对于任何k>0,P{|X-u|<kσ}=2Φ(k)-1其中,Φ(·)是标准正规定律的分布函数。特别是,当k=1,2,3时,P{|X-u|<σ}=P{u-σ<X<u+σ}≈0.6827,P{|X-u|<2σ}≈0.9545和P{|X-u|<3σ}≈0.9973。并给出如下公式:使用3-σ准则计算不同时间点的k-σ阈值,公式如下:使用Pri来表示蛋白质在i时间点的活动概率。因此,使用四个水平来表示基于3-σ准则的时间点i蛋白质的活动概率,其通过公式(4)计算。首先基于每种蛋白质的活动概率构建动态蛋白质相互作用网络。对于蛋白质p,当基因表达值大于Active_threshk(p)时,认为它在时间点i是活动的。蛋白质活动的时间点的集合可以表示为Tp={t1,t2,...,tm},1≤m≤36。如果蛋白质p和蛋白质q在静态网络上相互作用并且具有共同的活动时间点,则认为蛋白质p和q在动态PPI网络上彼此相互作用。CoT(p,q)=1表明蛋白质p和q在动态PPI网络上具有相互作用。步骤3:根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络,通过公式(6)可以有效地给出时间点i的边(p,q)的加权值:weight(ei(p,q))=Pr本文档来自技高网...

【技术保护点】
1.基于动态加权相互作用网络中关键蛋白质识别方法,其特征在于,包括如下步骤:(1)输入静态PPI网络和基因表达数据;(2)根据3‑σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络;(3)根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络;(4)根据蛋白质顶点之间的相互作用关系,计算边缘聚类系数;(5)根据蛋白质的生物特性,计算相互作用蛋白质对的基因本体相似度、皮尔逊相关系数;(6)根据蛋白质顶点间的权重值、基因本体相似度和皮尔逊相关系数计算蛋白质顶点重要性分数;(7)获得每个顶点的重要性分数并由大到小排序,排序后最大的k个值为关键蛋白质。

【技术特征摘要】
1.基于动态加权相互作用网络中关键蛋白质识别方法,其特征在于,包括如下步骤:(1)输入静态PPI网络和基因表达数据;(2)根据3-σ准则,计算蛋白质活动时间点和蛋白质活动概率,构建动态PPI网络;(3)根据蛋白质活动概率,计算蛋白质间相互作用权重,构建动态加权PPI网络;(4)根据蛋白质顶点之间的相互作用关系,计算边缘聚类系数;(5)根据蛋白质的生物特性,计算相互作用蛋白质对的基因本体相似度、皮尔逊相关系数;(6)根据蛋白质顶点间的权重值、基因本体相似度和皮尔逊相关系数计算蛋白质顶点重要性分数;(7)获得每个顶点的重要性分数并由大到小排序,排序后最大的k个值为关键蛋白质。2.根据权利要求1所述的基于动态加权相互作用网络中关键蛋白质识别方法,其特征在于...

【专利技术属性】
技术研发人员:刘维马良玉唐玉亮
申请(专利权)人:扬州大学
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1