一种基于结构域特征的关键蛋白质识别方法技术

技术编号：8131172 阅读：317 留言：0更新日期：2012-12-27 03:25

本发明专利技术公开了一种基于结构域特征的关键蛋白质识别方法。对于物种的全部蛋白质，该方法首先通过数据库或进行蛋白质序列分析等得到结构域信息，在结构域信息基础上统计各个结构域类型在蛋白质中出现次数，通过统计结果计算每个蛋白质的权重，权重越大蛋白质成为关键蛋白质的可能性越大。该方法简单有效，且仅基于蛋白质结构域信息，不依赖蛋白质相互作用网络信息等，避免了生物实验所消耗的大量人力物力。通过与随机方法比较，该方法能够较准确的识别关键蛋白质。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于系统生物学领域，涉及。
技术介绍
蛋白质是构成一切细胞和组织结构必不可少的成分，是生命活动最重要的物质基础。细胞中并不是每个蛋白质都具有同等重要性，而是不同的蛋白质对生命活动的重要性不尽相同。通常那些被剔除后造成有关生物功能丧失，并导致生物体无法生存或致病的蛋白质被称为关键蛋白质。关键蛋白质的识别能够从系统水平上为生物学、医学等提供有价值的信息，特别是在疾病诊疗、药物标靶设计、确定合成生物学上最小限度基因组(即包括一个物种全部关键基因)有重要的应用前景。目前，用于识别关键蛋白质的方法主要有三种( I)生物实验测定方法主要包括SGK (single gene knockouts)、RNA 干扰(RNA interference)、CK(conditional knockouts)和 WTM (who I e-genome transposon mutagenesis)等方法。通过生物实验可以准确地测定某一环境下的单个或几个关键蛋白质。但长期以来，生物实验方法因细胞培养等技术上的要求，只能在动物模型等上完成，如SGK基因敲除方法以小鼠建立动物模型。建立动物模型需要较长时间，进而观察和分析实验结果。另外，感染性细菌类生物，针对其进行关键蛋白质生物实验可行性较低。除耗时长久和物种局限外，生物实验成本十分昂贵且需投入大量人力物力。(2)基于多信息集成的分析方法为了提高识别关键蛋白质的准确率，有研究通过已知数据库中的蛋白质功能注释、蛋白质长度、基因表达、亚细胞定位、蛋白质相互作用网络等信息融合集成来评估蛋白质是否具关键性。基于多信息集成的分析方法大多...

【技术保护点】
一种基于结构域特征的关键蛋白质识别方法，其特征在于，包括以下步骤：步骤1：获取某一物种S的全部蛋白质，并获取每个蛋白质Pk的结构域类型集合D(S,Pk)={D1,D2,...Dt…}；为物种S的全部结构域类型集合；步骤2：统计每个结构域类型Di在该物种S全部蛋白质中的出现次数fDi；步骤3：计算各个蛋白质Pk的权重wk，将各蛋白质按照权重wk排序，权重wk越大表明该权重wk对应的蛋白质Pk越关键。FDA00001994256000011.jpg

【技术特征摘要】
1.一种基于结构域特征的关键蛋白质识别方法，其特征在于，包括以下步骤步骤I:获取某一物种S的全部蛋白质，并获取每个蛋白质Pk的结构域类型集合2.根据权利要求I所述的基于结构域特征的关键蛋白质识别方法，其特征在于，步骤2的具体过程为首先初始化物种S的全部结构域类型集合D (S)为空，并开始遍历该物种S的全部蛋白质；对于蛋白质Pk，检查蛋白质Pk拥有的全部结构域类...

【专利技术属性】
技术研发人员：王建新，成颖佼，彭玮，李敏，
申请(专利权)人：中南大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人