A novel conformation space optimization method based on local perturbation is proposed. Firstly, a large-scale conformation search is carried out by using Rosetta protocol. In the fourth stage of Rosetta protocol, the local perturbation of fragments is combined to enhance the exploration of conformation space and form a relatively complete secondary structure. Secondly, the secondary structure is disturbed. Kinetics can make the spatial arrangement of secondary structure closer to the real structure of protein and form a three-dimensional structure closer to natural protein, thus improving the accuracy of protein structure prediction. The present invention provides a population protein conformation space optimization method based on local disturbance with high prediction accuracy.
【技术实现步骤摘要】
一种基于局部扰动的群体蛋白质构象空间优化方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种基于局部扰动的群体蛋白质构象空间优化方法。
技术介绍
蛋白质分子是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。蛋白质的功能十分丰富,对机体的正常运行起着至关重要的作用。而蛋白质的三维结构决定着蛋白质的功能,蛋白质只有正确的折叠成特定的三维结构才能产生特有的生物功能。由于蛋白质错误折叠引起的疾病并不少见。因此,要了解蛋白质的功能、治愈与蛋白质有关的多种疾病,就必须获得蛋白质的三维结构。二十世纪末以来,生命科学领域飞速发展,作为生物体内分布最广、功能最复杂的一类大分子,蛋白质受到尤为广泛的关注和研究。蛋白质的三维结构预测是生物信息学的一个重要任务。不同的蛋白质拥有不同的氨基酸序列,所有蛋白质都会在其一维序列的基础上折叠形成特定的三维结构,了解蛋白质的三维结构是研究其生物功能的基础。目前蛋白质的三维结构主要通过X射线晶体衍射和核磁共振成像技术得到,但这两种通过实验的方法获取蛋白质结构的成本均不菲,并且有各自的应用局限。因此,通过计算机技术结合生物信息学的方法模拟蛋白质从氨基酸序列折叠成特定的空间结构的过程,从而预测蛋白质的三维结构就显得尤为重要。根据序列信息预测蛋白质三级结构依然是一个重大的难题。基于片段组装原理的技术是解决这项难题的最先进的方法,但是这种方法对较大、较难的蛋白质的预测精度不够。目前比较成功的从头蛋白质结构预测方法有DavidBaker及其团队设计的Rosetta方法、张阳及其团队开发的QUARK方法等。但是至 ...
【技术保护点】
1.一种基于局部扰动的群体蛋白质构象空间优化方法,其特征在于:所述群体构象空间优化方法包括以下步骤:1)输入预测蛋白质的序列信息和二级结构信息,并记录每一个二级结构的第一个和最后一个残基的残基号;2)设置参数:种群规模NP,二级结构扰动迭代次数G;3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP};4)片段局部扰动,过程如下:4.1)设n=1,其中n∈{1,2,...,NP};4.2)对种群中第n个个体Pn执行Rosetta协议第四阶段的3片段组装;4.3)随机选择构象Pn的一个3片段窗口,记该窗口第一个残基的Cα原子坐标为(x1,y1,z1)、最后一个残基的Cα原子坐标为(x2,y2,z2);4.4)令
【技术特征摘要】
1.一种基于局部扰动的群体蛋白质构象空间优化方法,其特征在于:所述群体构象空间优化方法包括以下步骤:1)输入预测蛋白质的序列信息和二级结构信息,并记录每一个二级结构的第一个和最后一个残基的残基号;2)设置参数:种群规模NP,二级结构扰动迭代次数G;3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP};4)片段局部扰动,过程如下:4.1)设n=1,其中n∈{1,2,...,NP};4.2)对种群中第n个个体Pn执行Rosetta协议第四阶段的3片段组装;4.3)随机选择构象Pn的一个3片段窗口,记该窗口第一个残基的Cα原子坐标为(x1,y1,z1)、最后一个残基的Cα原子坐标为(x2,y2,z2);4.4)令对单位化,得4.5)以矢量为旋转轴,对第一个残基的Cα原子与最后一个残基的Cα原子之间的所有原子进行旋转,得到新的构象Ptrial,过程如下:4.5.1)设r=1,其中需要进行旋转的原子的编号r∈{1,2,...,R},R表示需要旋转的原子的总数;4.5.2)生成[-5,5]的均匀分布随机数μ,作为旋转角;4.5.3)根据旋转轴和旋转角确定旋转矩阵:其中,c=cosμ,s=sinμ;4.5.4)记需要旋转的原子的坐标为(xold,yold,zold),则旋转后的坐标为(xnew,ynew,znew)=T(xold,yold,zold),即:其中Ti,j表示矩阵T的第i行第j列的元素,i和j均∈{1,2,3};4.5.5)计算构象Ptrial和Pn的能量,并根据Metropolis准则决定是否用Ptrial替换Pn;4.5.6)r=r+1;4.5.7)若r≤R,转至步骤4.5.2)执行下一个原子的旋转;否则,转至步骤4.6);4.6)n=n+1;4.7)若n≤NP,转至步骤...
【专利技术属性】
技术研发人员:张贵军,刘俊,彭春祥,周晓根,李远峰,余宝昆,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。