蛋白质结构空间构象的全信息预测方法技术

技术编号：12740202 阅读：189 留言：0更新日期：2016-01-21 01:47

本发明专利技术涉及一种蛋白质结构空间构象的全信息预测方法，属于生物信息学领域。对于任何蛋白质序列，运用蛋白质结构指纹技术，直接通过对5AAPFSC数据库的高通量筛选，就会得到其对应的蛋白折叠构象。每一个折叠构象将由蛋白折叠形状码字母来表示，这些折叠结构涵盖了二级结构和三级结构。全部可能的折叠形状码可以对齐形成一个列阵，生成一个PFSC蛋白空间构象谱带作为预测结果。通过对大量已知三维结构的蛋白质的测试，已经很好地验证了本发明专利技术方法的可靠性和有效性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种，属于生物信息学领域。
技术介绍
蛋白质结构是开展基因组学，生物信息学，药物研发和生物技术研究的重要的信息1’2。然而，到目前为止，只有大约不到1%的蛋白质的三维结构通过X-射线晶体衍射或核磁共振等实验方法测量获得3。仍然还有大约超过五千二百万个蛋白质的序列尚没有三维结构的信息和数据4，生物医药研究迫切希望能确定这些蛋白的空间结构。长期以来，以计算机建模为基础，已经开发了许多关于蛋白质结构预测的方法和应用。从1994年起，每两年举办一次的“蛋白质结构预测的关键评估(CASP) ”活动成为世界各国蛋白质分子生物科学家的一个交流平台5’6。鉴于蛋白质结构的复杂性，以及指数数量级的可能折叠方式，预测蛋白结构的研究难题被列为21世纪现代科学的一百个大挑战性课题之一 7。迄今为止，各种预测蛋白结构的方法基本上可分为三大类别。第一类是基于序列的建模方法8’9“°。该方法利用已知的蛋白结构来求解未知蛋白结构。这种方法需要依赖于序列之间的相似程度比对提取信息，关于预测结果的可靠程度一直是个疑问。第二类是采用折叠构型识别的拼接建模方法η’12’13’14’15。该方法采用统计方法从特定的蛋白数据库中筛选折叠片段和序列之间的相互关系。统计方法固然可以涵盖大多数折叠构型，但是频率较低的折叠构型往往就被忽略了。第三类是从头计算模型方法16’17’18。该方法运用计算机反复地迭代计算蛋白质中的氨基酸和原子之间的相互作用，直到最后整个构象体系趋于一个较低的能量状态。该方法消耗大量的计算机时间和资源，而且预测仅仅能得到相关蛋白质的一个可能空间结构。长期以来，...
<a href="http://www.xjishu.com/zhuanli/55/CN105260626.html" title="蛋白质结构空间构象的全信息预测方法原文来自X技术">蛋白质结构空间构象的全信息预测方法</a>

【技术保护点】
一种蛋白质结构空间构象的全信息预测方法，其特征在于，包括如下步骤： 1）从全部20个氨基酸中任意地提取5个氨基酸，形成总数为3,200,000的不同排列，每一个排列的可能折叠构象从全球蛋白质数据库获得，然后用蛋白折叠形状码表示；创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码，该数据库被命名为5AAPFSC； 2）对于任何一个待预测结构的蛋白质，沿着蛋白质的序列，从N‑端开始，逐步移动向C‑端，依次读取每5个连续的氨基酸，其可能具有的折叠构象从5AAPFSC数据库直接获得，用蛋白折叠形状码的字符表示；在蛋白质数据库中出现频率最高的折叠构象码的字符排在第一位，出现频率第二个高的折叠构象码字符排在第二位，从上到下依次形成一列，直至收集完全为止，每5个连续的氨基酸具有不同数目的折叠构象可能；3）待测蛋白质的全部可能的折叠形状码形成一个阵列，称为蛋白折叠构象谱带，代表了沿着蛋白质的序列全部可能的折叠构象；对于每一个蛋白序列，通过其全部可能的局部折叠构象的相互替代，可以准确地得到所有可能的构象；可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。

【技术特征摘要】

【专利技术属性】
技术研发人员：杨家安，
申请(专利权)人：麦科罗医药科技武汉有限公司，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人