一种基于残基接触信息辅助评价的蛋白质结构预测方法技术

技术编号:20122747 阅读:41 留言:0更新日期:2019-01-16 12:56
一种基于残基接触信息辅助评价的蛋白质结构预测方法,首先,利用Robetta和RaptorX‑Contact得到片段库和接触图;其次,在种群进化的两个阶段,以不同的方式利用接触图辅助评价构象;最后,通过聚类得到最终预测结果。本发明专利技术利用接触图信息,辅助评价构象,保留拓扑正确的构象,从而提高搜索效率,提高预测精度。本发明专利技术提供一种预测精度较高的基于残基接触信息辅助评价的蛋白质结构预测方法。

A Protein Structure Prediction Method Based on Residue Contact Information Assisted Assessment

A protein structure prediction method based on residue contact information assisted evaluation is proposed. Firstly, the fragment library and contact map are obtained by Robetta and RaptorX Contact. Secondly, in the two stages of population evolution, the conformation is evaluated by using contact map assisted evaluation in different ways. Finally, the final prediction results are obtained by clustering. The invention utilizes contact map information to assist in evaluating conformation and retains the correct topological conformation, thereby improving search efficiency and prediction accuracy. The invention provides a protein structure prediction method based on residual contact information assistant evaluation with high prediction accuracy.

【技术实现步骤摘要】
一种基于残基接触信息辅助评价的蛋白质结构预测方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种基于残基接触信息辅助评价的蛋白质结构预测方法。
技术介绍
蛋白质结构是指蛋白质分子的空间结构。蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子,所有蛋白质都是由20种不同氨基酸连接形成的多聚体,在形成蛋白质后,这些氨基酸又被称为残基。蛋白质大小的范围可以从这样一个下限一直到数千个残基。目前估计的蛋白质的平均长度在不同的物种中有所区别,一般约为200-380个残基,而真核生物的蛋白质平均长度比原核生物长约55%。更大的蛋白质聚合体可以通过许多蛋白质亚基形成;如由数千个肌动蛋白分子聚合形成蛋白纤维。要发挥生物学功能,蛋白质需要正确折叠为一个特定构型,主要是通过大量的非共价相互作用(如氢键,离子键,范德华力和疏水作用)来实现;此外,在一些蛋白质(特别是分泌性蛋白质)折叠中,二硫键也起到关键作用。为了从分子水平上了解蛋白质的作用机制,常常需要测定蛋白质的三维结构。由于高通量测序技术的快速发展,加之实验解析蛋白质三维结构技术(X射线晶体学、核磁共振光谱、电本文档来自技高网...

【技术保护点】
1.一种基于残基接触信息辅助评价的蛋白质结构预测方法,其特征在于,所述蛋白质结构预测方法包括以下步骤:1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;2)利用RaptorX‑Contact预测该序列的接触图,获得接触概率大于0.6的N个残基对,接触是指Cα‑Cα欧氏距离小于

【技术特征摘要】
1.一种基于残基接触信息辅助评价的蛋白质结构预测方法,其特征在于,所述蛋白质结构预测方法包括以下步骤:1)给定输入序列信息,利用Robetta服务器获得该序列的片段库;2)利用RaptorX-Contact预测该序列的接触图,获得接触概率大于0.6的N个残基对,接触是指Cα-Cα欧氏距离小于接触概率表示为Pk,k∈{1,...,N};3)初始化:种群规模NP,种群第一阶段和第二阶段最大迭代次数分别为G1,G2,根据输入序列,执行RosettaAbinitio协议的第一与第二阶段NP次,产生初始构象种群P={C1,C2,...,CNP},其中CNP表示第NP个个体,记当前代数g=0;4)进入种群进化第一阶段,过程如下:4.1)对种群所有个体Ci,i∈{1,...,NP}进行片段组装,片段长度为9,得到候选个体C′i;4.2)根据N个残基对的接触概率分别计算Ci和C′i的评分函数影响因子μ和μ′:其中dk和d′k分别是Ci和C′i的第k对残基间的Cα-Cα距离,μk和μ′k是对应评分函数影响因子的分项;4.3)根据能量函数Rosettascore3计算Ci和C′i的能量值Escore3、E′score3:4.4)利用评分影响因子计算Ci和C′i基于接触的评分s=μEscore3,s′=μ′E′score3,并利用Metropolis准则概率接受,若接受,则令Ci=C′i;4.5)遍历种群所有个体,得到下一代种群,令g=g+1;5)累计学习种群残基对距离分布,过程如下:5.1)残基对间...

【专利技术属性】
技术研发人员:张贵军谢腾宇孙科周晓根郝小虎王柳静
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利