A method of protein three-dimensional structure prediction based on conformational diversity strategy is proposed. Under the framework of genetic algorithm, Rosetta standard protocol is adopted; the conformational loop region is manipulated by genetic operators to enhance the spatial search of loop region; the diversity index based on secondary structure information is introduced, and the conformational loop region is combined with the conformational loop region. As the selection criterion of population renewal, energy value can enhance the diversity of population while reducing the adverse effects of imprecise energy function, thus predicting the near-natural conformation with higher accuracy. The present invention provides a protein three-dimensional structure prediction method based on conformational diversity strategy with high prediction accuracy.
【技术实现步骤摘要】
一种基于构象多样性策略的蛋白质三维结构预测方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种基于构象多样性策略的蛋白质三维结构预测方法。
技术介绍
蛋白质分子是组成人体一切细胞、组织的重要成分。机体所有重要的组成部分都需要有蛋白质的参与。蛋白质的功能十分丰富,对机体的正常运行起着至关重要的作用。而蛋白质的三维结构决定着蛋白质的功能,蛋白质只有正确的折叠成特定的三维结构才能产生特有的生物功能。由于蛋白质错误折叠引起的疾病并不少见。因此,要了解蛋白质的功能、治愈与蛋白质有关的多种疾病,就必须获得蛋白质的三维结构。二十世纪末以来,生命科学领域飞速发展,作为生物体内分布最广、功能最复杂的一类大分子,蛋白质受到尤为广泛的关注和研究。蛋白质的三维结构预测是生物信息学的一个重要任务。不同的蛋白质拥有不同的氨基酸序列,所有蛋白质都会在其一维序列的基础上折叠形成特定的三维结构,了解蛋白质的三维结构是研究其生物功能的基础。目前蛋白质的三维结构主要通过X射线晶体衍射和核磁共振成像技术得到,但这两种通过实验的方法获取蛋白质结构的成本均不菲,并且有各自的应用局限。因此,通过计算机技术结合生物信息学的方法模拟蛋白质从氨基酸序列折叠成特定的空间结构的过程,从而预测蛋白质的三维结构就显得尤为重要。从头蛋白质结构预测方法得尤为重要。从头蛋白质结构预测方法不依赖任何已知结构,而是从蛋白质的氨基酸序列出发,根据Anfinsen原则,通过构象搜索方法搜寻目标蛋白质的天然结构。从头蛋白质预测方法的发展也是对“第二遗传密码”的探索过程,具有非凡的物理意义。目前比较成功的从头蛋白质结构预 ...
【技术保护点】
1.一种基于构象多样性策略的蛋白质三维结构预测方法,其特征在于:所述蛋白质三维结构预测方法包括以下步骤:1)给定预测蛋白质序列信息;2)设置系统参数:种群规模N,种群的进化次数Gmax,重组概率pc,变异概率pm;3)第一阶段,种群初始化:迭代Rosetta协议第一阶段的片段组装,产生具有N个个体的初始种群
【技术特征摘要】
1.一种基于构象多样性策略的蛋白质三维结构预测方法,其特征在于:所述蛋白质三维结构预测方法包括以下步骤:1)给定预测蛋白质序列信息;2)设置系统参数:种群规模N,种群的进化次数Gmax,重组概率pc,变异概率pm;3)第一阶段,种群初始化:迭代Rosetta协议第一阶段的片段组装,产生具有N个个体的初始种群令4)第二、三、四阶段基于相应的Rosetta协议,分别执行步骤5)至步骤9);5)开始迭代,设g=1,其中种群代数g∈{1,2,...,Gmax};6)对种群Pnew中的每一个个体Pinew,其中i∈{1,2,...,N},使用Rosetta协议相应阶段的片段组装进行构象搜索,产生下一代种群P={P1,P2,...,PN},g=g+1;7)对种群P中的个体执行遗传算子操作和局部搜索,产生新的种群P*,过程如下:7.1)对种群P中的个体随机两两配对,生成N/2对父本<Pi,Pj>,其中i,j均∈{1,2,...,N},且i≠j;7.2)执行重组操作:对每一对父本,生成随机数rand1∈[0,1];当rand1≤pc,随机交换Pi和Pj的一个loop区域的残基二面角值,产生对应的新构象个体Pi′,Pj′,所有父本执行完重组操作后形成新的种群P′;7.3)执行变异操作:对种群P′中的每一个个体Pi′,其中i∈{1,2,...,N},进行变异,过程如下:7.3.1)检测个体Pi′的每一个滑动窗口Wik中是否含有二级结构为loop的残基,其中k∈{1,2,...,l-f+1},l表示蛋白质序列的长度,f∈{3,9}表示片段的长度,第二、三阶段f=9,第四阶段f=3;7.3.2)若Wik中含有二级结构为loop残基:生成随机数rand2∈[0,1];rand2≤pm,执行一次片段插入,对该窗口中的loop残基进行变异;7.3.3)遍历完所有窗口后,产生新的个体Pi″;7.3.4)所有个体执行完变异操作后形成新的种群P″;7....
【专利技术属性】
技术研发人员:张贵军,刘俊,王柳静,谢腾宇,周晓根,马来发,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。