【技术实现步骤摘要】
本专利技术属于系统生物学
,涉及蛋白质相互作用网络中关键蛋白质的识别,具体涉及基于基因表达与亚细胞定位信息的蛋白质网络精炼方法。
技术介绍
多物种全基因组测序的完成以及人类基因组计划的开展,使生命科学研究的重点正在从基因组学向蛋白质组学转移。所有的生物,包括人类和细菌,蛋白质都是其构成所有细胞和组织结构无法或缺的部分。它能构成维持机体新陈代谢所需要的各种酶类以及与机体免疫反应息息相关的抗体,还参与构成调节人体各种生理机能的激素,是生命活动极其重要的物质基础。Winzeler等通过基因剔除式突变将某些重要的蛋白移除后会造成相关的蛋白质复合物失去功能,继而使生物体无法维持生存。所以我们认为在生命活动中,不同蛋白质的重要性是有区别的。于是我们将蛋白质分为两类:关键蛋白质(essential proteins)和非关键蛋白质(non-essential proteins)。关键蛋白质是生物体生存和繁殖所必需的蛋白质。由于关键蛋白质在生命活动中扮演重要角色,因此对于关键蛋白质的预测与识别成为一项重要的研究工作。过去关键蛋白在生物学上的识别主要通过生物实验,像RNA干扰、单基因敲除、条件性基因剔除等。与计算生物学相比,使用生物技术固然能得到有效的结论,但是代价相对高而效率相对低,并且适用的物种范围有局限性。所以,使用计算生物学的方法来预测关键蛋白质是该领域的又一个值得研究的方向。随着酵母双杂交、串联亲和纯化、质谱分析、蛋白质芯片和噬菌体显示等高通量蛋白质组技术的发展,以及基于计算生物学的蛋白质相互作用预测技术的日趋成熟,可获得的蛋白质相互作用数据迅速增长,大量 ...
【技术保护点】
基于基因表达与亚细胞定位信息的蛋白质网络精炼方法,其特征在于,具体按照以下步骤进行:步骤1,使用生物相关数据集,包括蛋白质相互作用网络、时间序列下的基因表达数据、蛋白质亚细胞位置信息;步骤2,利用时间相关模型与时间不相关模型过滤时间序列下的基因表达数据;对每一个蛋白质v计算其活性阈值Active_th(v),如果该蛋白质v在时刻i对应的基因表达值大于活性阈值,即EV(v,i)>Active_th(v),则表明蛋白质v在时刻i是活跃的,记作ti(v)=1;步骤3,对S‑PIN中的每条边e(u,v),如果边e连接的两个蛋白质节点u和v在所有时间点都不同时满足活性的判决条件,即在所有的时刻都不存在EV(u,i)>Active_th(u)和EV(v,i)>Active_th(v)同时成立,则将边e(u,v)从S‑PIN中移除;对S‑PIN中的每条边e(u,v),如果边e连接的两个蛋白质节点u和v不出现在任意一个共同的亚细胞位置中,则将边e(u,v)从S‑PIN中移除;输出过滤后的S‑PIN的边集E,即为精炼后的蛋白质网络TS‑PIN。
【技术特征摘要】
1.基于基因表达与亚细胞定位信息的蛋白质网络精炼方法,其特征在于,具体按照以下步骤进行:步骤1,使用生物相关数据集,包括蛋白质相互作用网络、时间序列下的基因表达数据、蛋白质亚细胞位置信息;步骤2,利用时间相关模型与时间不相关模型过滤时间序列下的基因表达数据;对每一个蛋白质v计算其活性阈值Active_th(v),如果该蛋白质v在时刻i对应的基因表达值大于活性阈值,即EV(v,i)>Active_th(v),则表明蛋白质v在时刻i是活跃的,记作ti(v)=1;步骤3,对S-PIN中的每条边e(u,v),如果边e连接的两个蛋白质节点u和v在所有时间点都不同时满足活性的判决条件,即在所有的时刻都不存在EV(u,i)>Active_th(u)和EV(...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。