一种基于锦标赛机制的自适应蛋白质结构预测方法技术

技术编号:20567670 阅读:31 留言:0更新日期:2019-03-14 09:57
一种基于锦标赛机制的自适应蛋白质结构预测方法,在基本的进化算法框架下,首先,种群初始化,然后从构象池中等概率随机选择一个变异策略引导目标构象进行变异,交叉,其中交叉因子随代数线性递增;其次根据Rosetta能量函数score3以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,并且保存成功更新的信息,基于锦标赛机制的自适应蛋白质结构预测方法,不仅能够缓解能量函数不精确的问题,而且可以根据历史信息引导算法尽可能采样得到能量更低且结构更合理的构象,同时提高采样效率。本发明专利技术提供一种预测精度较高的基于锦标赛机制的自适应蛋白质结构预测方法。

【技术实现步骤摘要】
一种基于锦标赛机制的自适应蛋白质结构预测方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种基于锦标赛机制的自适应蛋白质结构预测方法。
技术介绍
蛋白质结构预测是指从蛋白质的氨基酸序列中预测蛋白质的三维结构。蛋白质结构预测是生物信息学与理论化学所追求的最重要目标之一;它在医学上和生物技术上都是非常重要的。蛋白质结构预测方法可以分为三种:同源建模法、从头预测方法和穿线法。同源建模法的理论依据是如果两个蛋白质的序列比较相似,则其结构也有很大可能比较相似。相关研究表明,如果序列相似性高于75%,则可以使用这种方法进行粗略的预测。这类方法优点是精确度高,缺点是只能处理和模板库中蛋白质序列相似性较高的情况。穿线法的原理是取出一条模板和查询序列比对,并将模板蛋白质与查询序列匹配上的残基的空间坐标赋给查询序列上相应的残基。从头预测法是根据热力学理论,即求蛋白质能量的最小状态。生物学家和物理学家等认为从原理上讲这是影响蛋白质结构的本质因素。从头预测方法不依赖于已知结构,直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化方法是目前制约蛋白质结构从头预测精度关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下两个方面的问题:(1)能量的复杂性。(2)能量模型的不精确性。目前,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然结构;此外,模型的不精确性也会导致无法对优化算法性能进行客观地分析。到目前还没有一种十分完善的方法来预测蛋白质的三维结构,即使获得了很好的预测结果,但也只是针对某些蛋白质而言的,目前主要的技术瓶颈在于两个方面,第一方面在于采样方法,现有技术对构象空间采样能力不强,另一方面在于构象更新方法,现有技术对构象的更新精度仍然不足。因此,现有的蛋白质结构预测方法采样效率和预测精度方面存在不足,需要改进。
技术实现思路
为了克服现有的蛋白质结构预测方法种群多样性差、预测精度较低的不足,本专利技术在基本差分进化算法框架下,引入策略自适应的方法来指导构象空间优化,提出一种采样效率好、预测精度高的基于锦标赛机制的自适应蛋白质结构预测方法。本专利技术解决其技术问题所采用的技术方案是:一种基于锦标赛机制的自适应蛋白质结构预测方法,所述预测方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器(http://www.robetta.org/)上得到片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,置迭代代数g=0;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)对种群中的每个个体Ci进行如下操作:5.1)将Ci设为目标个体从以下变异策略池5.1.1)~5.1.5)中等概率的随机选择一个变异策略指导构象进行变异操作:5.1.1)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca和Cb中随机选择一个位置不同的9片段,分别替换Cbest对应位置的片段生成变异构象5.1.2)从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的9片段,分别替换Ca对应位置的片段生成变异构象5.1.3)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca、Cb和Cbest中随机选择一个位置不同的9片段,分别替换对应位置的片段生成变异构象5.1.4)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出四个互不相同的个体Ca、Cb、Cc和Cd,分别从Cb、Cc、Cd、Cd和Cbest中随机选择一个位置不同的3片段,分别替换对应位置的片段生成变异构象5.1.5)从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Ca、Cb和Cc中随机选择一个位置不同的9片段,分别替换对应位置的片段生成变异构象5.2)对生成的变异构象进行一次片三段组装生成新变异构象5.3)生成随机数pCR,其中pCR∈(0,1),若pCR<CR,则从中随机选择一个3片段,替换到对应的位置的片段生成测试构象否则直接把记为5.4)用Rosetta能量函数score3计算的能量如果则替换并将成功标志fi设置为1,否则fi=0;如果则按照概率以蒙特卡洛准则接收构象,若接收构象,则替换6)对种群中的每个个体Ci进行如下操作:6.1)如果目标构象的成功标志fi=1且g≠0,则按照在上一代的变异策略对其进行变异生成并且对进行一次三片段组装生成新变异构象执行步骤5.3)~5.4),如果测试构象不被接收,则进行步骤5.1)~5.4);6.2)如果目标构象的成功标志fi=0或g=0,则进行步骤5.1)~5.4);7)g=g+1,迭代运行步骤6)~7),至g>G为止;8)输出能量最低的构象为最终结果。本专利技术的技术构思为:在基本的进化算法框架下,首先,种群初始化,然后从构象池中等概率随机选择一个变异策略引导目标构象进行变异,交叉,其中交叉因子随代数线性递增;其次根据Rosetta能量函数score3以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,并且保存成功更新的信息,基于锦标赛机制的自适应蛋白质结构预测方法,不仅能够缓解能量函数不精确的问题,而且可以根据历史信息引导算法尽可能采样得到能量更低且结构更合理的构象,同时提高采样效率。本专利技术提供一种基于锦标赛机制的自适应蛋白质结构预测方法。本专利技术的有益效果为:根据种群更新的信息,尽可能选择使构象成功更新的变异策略和相应的参数,不仅能够提高采样效率,而且能够保持种群多样性;使用蒙特卡洛概率接收准则辅助构象选择,缓解了能量函数不精确导致的预测误差问题,进而提高预测精度。附图说明图1是一种基于锦标赛机制的自适应蛋白质结构预测方法对蛋白质1ENH采样得到的构象分布图。图2是一种基于锦标赛机制的自适应蛋白质结构预测方法对蛋白质1ENH采样时的构象更新示意图。图3是一种基于锦标赛机制的自适应蛋白质结构预测方法对蛋白质1ENH结构预测得到的三维结构。具体实施方式下面结合附图对本专利技术作进一步描述。参照图1~图3,一种基于锦标赛机制的自适应蛋白质结构预测方法,所述预测方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器(http://www.robetta.org/)上得到片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,置迭代代数g=0;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)对种群中的每个个体Ci进行如下操作:5.1)将Ci设为目标个体从以下变异策略池5.1.1)~5.1.5)中等概率的随机选择一个变异策略指导构象进行变异操作:5.1.1)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca和Cb中随机选择一个位置不同的9片段,分别替换Cbest对应位置的片段生成变异构象5.1.2)从种群中随机选出三个互不相同的个体Ca、本文档来自技高网
...

【技术保护点】
1.一种基于锦标赛机制的自适应蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,置迭代代数g=0;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)对种群中的每个个体Ci进行如下操作:5.1)将Ci设为目标个体

【技术特征摘要】
1.一种基于锦标赛机制的自适应蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,置迭代代数g=0;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)对种群中的每个个体Ci进行如下操作:5.1)将Ci设为目标个体从以下变异策略池5.1.1)~5.1.5)中等概率的随机选择一个变异策略指导构象进行变异操作:5.1.1)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca和Cb中随机选择一个位置不同的9片段,分别替换Cbest对应位置的片段生成变异构象5.1.2)从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的9片段,分别替换Ca对应位置的片段生成变异构象5.1.3)先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca、Cb和Cbest中随机选择一个位置不同的9片段,分别替换对应位置的片段生成变异构象5.1.4)先从种群中选择一个能量最低的个体Cbe...

【专利技术属性】
技术研发人员:张贵军彭春祥刘俊周晓根王柳静胡俊
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1