当前位置: 首页 > 专利查询>重庆大学专利>正文

一种蛋白质的β-转角结构预测及特征分析方法技术

技术编号:2822937 阅读:356 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种蛋白质的β-转角结构预测及特征分析方法,能够用于蛋白质β-转角结构预测,并为蛋白质的折叠识别研究以及蛋白质的整个三维结构预测提供参考,包括如下步骤:a)基于因子分析方法,构建氨基酸广义信息因子分析标度;b)应用氨基酸广义信息因子分析标度对蛋白质结构中足可解释β-转角结构特征的7-残基滑动序列片断进行表征;c)用线性判别分析建立蛋白质的β-转角结构识别及特征分析模型;d)采取排除非卷曲区域中的残基和状态翻转规则两步过滤措施,保证β-转角预测结果的真实性。

【技术实现步骤摘要】

本专利技术涉及一种蛋白质的二级结构预测及特征分析方法,特别是一种蛋 白质的|3-转角结构预测及特征分析方法。
技术介绍
蛋白质体系由a-螺旋,P-折叠,紧密转角,膨胀结构及无规则巻曲结构 等构成。过去几十年,已发展多种预测a-螺旋与P-折叠预测方法,相比之 下,紧密转角预测方法发展较少,(3-转角是紧密转角的一种,其由4个连续 残基构成,可定义为Ca(i)与Ca(i+3)之间的距离小于0.7 nm,且此4肽片 断不存在于螺旋形构象之中。P-转角是蛋白质中已被认识的非重复性结构中 最常见的类型,其在蛋白质结构与功能中具有重要作用。首先,其对蛋白质 的折叠与稳定性至关重要;第二, P-转角通常出现在蛋白质的暴露表面,其 可能参与分子识别及受体与底物相互作用过程。因此,发展有效的P-转角预 测方法对蛋白质的折叠识别研究以及蛋白质的整个3D结构预测将很有益。 现已发展的一些较好的|3-转角结构预测方法有Chou-Fasman方法 (Biochemistry, 1974, 13: 222)。 1-4与2國3相关性模型(Zhang, et al., Biopolymers, 1997, 41: 673),其考虑了 1与4, 2与3残基之间的交互效应。 序列连接模型(Chou, J. Pept. Res., 1997, 49: 120),该模型首次引入马尔可夫 链,考虑了整个寡肽的序列相关效应。GORBTURN(v3.0)方法(Wilmot,eta1., 19卯,3:479),其应用位置频率与等价参数,从P-转角预测结果中剔除可能 的helix与strand残基。Shepherd等(Protein Sci., 1999, 8: 1045)发展了 一种基 于神经网络的预测方法一BTPRED方法,Kaur等(Bioinformatics, 2002, 18: 1508)曾对各种P-转角预测方法的同步评i"介结果显示,BTPRED方法正确率 最高,其又进一步应用多元序列对比发展了 一种改进的神经网络方法—BTPred2(ProteinSci., 2003, 12: 627),得马休斯相关系数(MCC)为0.43。更 最近,Kim(Bioinfo腿tics, 2004, 20: 40)用 k-最近邻法及Zhang等 (Bioinformatics, 2005, 21: 2370)用支持向量才几都取得4交好的p-转角预测结 果。纵观上述算法,其大多是基于位置倾向的经验方法,尽管p-转角是非重 复结构中最常见的一种,但目前的二级结构预测方法提供关于P-转角的有用 信息却较少(Kaur, et al" Bioinformatics, 2002, 18: 1508)。
技术实现思路
有鉴于此,为了解决上述问题,本专利技术提供了一种蛋白质的P-转角结构 预测及特征分析方法,能够用于蛋白质P-转角结构预测及特征分析,并为蛋白 质的折叠识别研究以及蛋白质的整个三维结构预测提供参考。本专利技术的目的是这样实现的 一种蛋白质的P-转角结构预测及特征分析 方法,包括如下步骤a) 基于因子分析方法,构建氨基酸广义信息因子分析标度;b) 应用氨基酸广义信息因子分析标度对蛋白质结构中足可解释|3-转角结构 特征的7-残基滑动序列片断进行表征;c) 用线性判别分析建立蛋白质的p-转角结构识别及特征分析模型;d) 采取排除非巻曲区域中的残基和状态翻转规则两步过滤措施,保证p-转 角预测结果的真实性。进一步,在于步骤a)具体包括如下步骤al)选取天然氨基酸的变量参数,按照相对负载大小、变量共同度、可 解释性及对序列结构贡献的重要性进行变量筛选;a2)用因子分析法处理精选得到的变量,通过斜交旋转,并用主成分法 提取疏水性、a-螺旋与转角倾向、体积性质、构成特征、局部柔性和静电性6 个因子;a3)计算各因子得分,将得分矢量定义为氨基酸广义信息因子分析标度; 进一步,步骤b)具体包括用氨基酸广义信息因子分析标度所涉及的疏水性、a-螺旋与转角倾向、体积性质、构成特征、局部柔性和静电性6个因子 对蛋白质结构中足可解释(3-转角结构特征的7-残基滑动序列片断进行表征,其 中的每个氨基酸残基用6个氨基酸广义信息因子分析标度矢量表征,并将表征 结果作为P-转角结构识别模型的自变量;进一步,步骤c)具体包括如下步骤首先定义两个指示变量,分别用"l" 表示p-转角结构,用"2,,表示非p-转角结构,以此指示变量作为p-转角结构预 测模型的因变量,用线性判别分析建立p-转角结构预测模型;进一步,步骤d)具体包括如下步骤采取排除非巻曲区域中的残基和状 态翻转规则两步过滤措施,保证P-转角预测结果的真实性。本专利技术的一种蛋白质的(3-转角结构预测及特征分析方法,其中选取的氨基 酸广义信息因子分析标度所含信息量大、表征能力强、使用操作方便及物化意 义明显;通过表征p-转角所在的7-残基滑动序列片断的结构特征,可全面地表 征p-转角结构特征;线性判别分析建模具有简便且易解释等优点,对模型分析 可以获得关于|3-转角的一些重要特征信息。本专利技术的其他优点、目标和特征在某种程度上将在随后的说明书中进行 阐述,并且在某种程度上,基于对下文的考察研究对本领域技术人员而言将 是显而易见的,或者可以从本专利技术的实践中得到教导。本专利技术的目标和其他 优点可以通过下面的说明书,权利要求书,以及附图中所特别指出的结构来 实现和获得。附图说明为了使本专利技术的目的、技术方案和优点更加清楚,下面将结合附图对本 专利技术作进一步的详细描述,其中图1是本专利技术的线性判别分析模型的标准化系数图; 图2是本专利技术的由4残基肽形成的P-转角结构示意图。具体实施例方式以下将参照附图,对采用本专利技术的方法用于426个蛋白样本中P-转角结 构预测及特征分析进行详细的描述,包括以下步骤a)基于因子分析方法,构建氨基酸广义信息因子分析标度; 从AAindex数据库(参见Kawashima S., Kanehisa M.. Nucleic Acids Res. , 2000,28:374)中选择20种天然氨基酸的516个变量参数。按照相对负载大小、 变量共同度、可解释性及对序列结构贡献的重要性等原则对这516个变量进 行篩选,得到335个变量。这些变量表征氨基酸的如下性质,a-螺旋与转角倾 向性质,如p-转角构象参数及C末端螺旋的标准化频率等;P倾向性质,如N 末端P-折叠的标准化频率等;疏水性,如三氟乙酸中的保留系数及疏水性指数 等;物理化学性质,如表观偏特定体积及分子大小等;构成特征,如电荷转移 给予能力参数及热能参数等;其它特性,如侧链角e及N末端非螺旋区域的标 准化频率等。用因子分析法处理精选得到的变量,通过斜交旋转,并用主成分法提取 6个因子,这6个因子解释了原始变量83.47%的信息,参见表l。表1 20种天然氩基酸的335个性质Wt的6个因子得分因子l: 因子2: 因子3: 因子4: 因子5: 因子6:<table>table see original document page 7</column></row><table><table>table see orig本文档来自技高网
...

【技术保护点】
一种蛋白质的β-转角结构预测及特征分析方法,其特征在于包括如下步骤:a)基于因子分析方法,构建氨基酸广义信息因子分析标度;b)应用氨基酸广义信息因子分析标度对蛋白质结构中足可解释β-转角结构特征的7-残基滑动序列片断进行表征;c)用线性判别分析建立蛋白质的β-转角结构识别及特征分析模型;d)采取排除非卷曲区域中的残基和状态翻转规则两步过滤措施,保证β-转角预测结果的真实性。

【技术特征摘要】

【专利技术属性】
技术研发人员:梁桂兆梅虎杨力李志良
申请(专利权)人:重庆大学
类型:发明
国别省市:85[中国|重庆]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1