一种基于残基接触信息交叉策略的蛋白质结构预测方法技术

技术编号：20392653 阅读：25 留言：0更新日期：2019-02-20 03:58

一种基于残基接触信息交叉策略的蛋白质结构预测方法，首先，利用Robetta和RaptorX‑Contact得到片段库和接触图；其次，利用接触图信息使得种群个体动态进入片段组装阶段和Loop区域微调阶段，并使用了特定测试个体和特定区域的交叉策略；最后，通过聚类得到最终预测结果。本发明专利技术可以利用接触图信息，动态进行种群进化，并利用特定区域的交叉策略，提高搜索效率，提高预测精度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于残基接触信息交叉策略的蛋白质结构预测方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域，尤其涉及的是一种基于残基接触信息交叉策略的蛋白质结构预测方法。
技术介绍
蛋白质是所有生物中最重要的大分子之一，一个细胞的干重的一半以上是蛋白质。蛋白质分子是由氨基酸首尾相连缩合而成的共价多肽链，但是天然蛋白质分子并不是走向随机的松散多肽链。每一种天然蛋白质都有自己特有的空间结构或称三维结构，这种三维结构通常被称为蛋白质的构象，即蛋白质的结构。蛋白质结构调节生物体中的细胞活动，以保持生命。蛋白质分子在分子水平上具体体现了蛋白质结构和功能之间的显著关系。蛋白质在生物学中有许多不同的功能。蛋白质的三维天然结构决定它的生物学机制，而反过来，蛋白质氨基酸单体的一维链又对它的天然结构进行编码。蛋白质的三维结构在药物设计、蛋白质工程和生物技术中具有决定性的重要，因此，蛋白质结构预测是一个重要的研究问题。由于高通量测序技术的快速发展，加之实验解析蛋白质三维结构技术(X射线晶体学、核磁共振光谱、电子显微镜以及冷冻电镜)耗时且代价昂贵，导致已知序列数目和解析出的蛋白质结构数目间的鸿沟呈指数增加。此外，生物学中心法则中的第二遗传密码和蛋白质折叠机理需要研究学者们进行探索。因此，在无全长模板的情况下(序列相似度<20％)，利用计算机，结合优化算法，从氨基酸序列开始，从头预测蛋白质结构是一个研究方法。Anfinsen热力学假说表明：蛋白质的空间结构由氨基酸序列唯一确定；蛋白质的空间结构是稳定的；蛋白质的天然构象处于自由能最低点。根据Anfinsen原则，以计算机为工具...

【技术保护点】
1.一种基于残基接触信息交叉策略的蛋白质结构预测方法，其特征在于：所述蛋白质结构预测方法包括以下步骤：1)给定输入序列信息，利用Robetta服务器获得该序列的片段库；2)利用RaptorX‑Contact预测该序列的接触信息，并且记录接触概率大于0.6的残基对，假设有N个残基对的接触概率满足该条件，并记第k个残基对间的接触，接触指Cα‑Cα欧氏距离

【技术特征摘要】
1.一种基于残基接触信息交叉策略的蛋白质结构预测方法，其特征在于：所述蛋白质结构预测方法包括以下步骤：1)给定输入序列信息，利用Robetta服务器获得该序列的片段库；2)利用RaptorX-Contact预测该序列的接触信息，并且记录接触概率大于0.6的残基对，假设有N个残基对的接触概率满足该条件，并记第k个残基对间的接触，接触指Cα-Cα欧氏距离接触概率表示为Pk，满足Pk＞0.6，k∈{1,...,N}，并记第k个残基对的残基索引号ik和jk，并满足ik＜jk；3)初始化：种群规模NP，根据输入序列，最大迭代次数分别为G，执行RosettaAbinitio协议的第一与第二阶段NP次，产生初始构象种群P＝{C1,C2,...,CNP}，其中CNP表示第NP个个体，记当前代数g＝0；4)遍历初始种群的所有个体Cm,m∈{1,..NP}，作为目标个体Ctarget进入种群进化的片段组装阶段，并计算当前目标个体的N个残基对的接触情况，tk＝1表示第k对残基对接触，tk＝0表示第k对残基对不接触；5)片段组装阶段，过程如下：5.1)对当前目标个体不接触的残基对，找出接触图中接触概率最大的不接触残基对r，r∈{1,...,N}；5.2)从当前种群中选择一个不同于当前目标个体的个体Crandom，该个体需要满足dr,random＜dr,target，dr,random和dr,target分别表示Crandom和Ctarget的第r个残基对的Cα-Cα欧氏距离；如果当前种群所有个体不满足该条件，则执行下一步；否则执行步骤5.4)；5.3)对目标个体进行随机的片段组装，随机选择窗口，并从对应的片段库中随机选择片段得到测试个体Ctrial5.4)Crandom与Ctarget交叉：与若jr-ir＞L/2，则从Crandom的第ir号残基到jr号残基中随机选取长L/2的连续区域，作为片段，其中L是目标序列长度；否则，直接...

【专利技术属性】
技术研发人员：张贵军，谢腾宇，王小奇，周晓根，郝小虎，胡俊，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人