一种下界估计策略自适应蛋白质结构预测方法技术

技术编号:20366710 阅读:30 留言:0更新日期:2019-02-16 18:17
一种下界估计策略自适应蛋白质结构预测方法,在进化算法框架下,首先,种群初始化,根据轮盘赌的方法选择不同的策略对构象进行变异,交叉;其次根据下界估计函数,Rosetta能量函数score3、以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,根据构象更新的历史信息动态更新策略选择概率,下界估计策略自适应蛋白质结构预测方法不仅能够缓解能量函数不精确的问题,而且可以根据历史信息引导算法采样得到能量更低且结构更合理的构象,同时提高采样效率。本发明专利技术提供一种采样效率和预测精度都较高的下界估计策略自适应蛋白质结构预测方法。

【技术实现步骤摘要】
一种下界估计策略自适应蛋白质结构预测方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种下界估计策略自适应蛋白质结构预测方法。
技术介绍
计算机硬件和软件技术的快速发展,为从头预测方法的发展提供了结实的基础平台条件。2012年《Science》杂志发表的一篇综述文章中,美国科学院院士Dill教授回顾了50年来从头预测领域取得的进展,并指出在寻求这一问题答案的过程中,极大推动了超级计算机、新材料和药物发现的发展,帮助人们理解生命的基本过程。从头预测方法目前还面临着诸多困难和挑战。从头预测方法直接基于蛋白质物理或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。构象空间优化方法是目前制约蛋白质结构从头预测精度关键的因素之一。优化算法应用于从头预测采样过程必须首先解决以下三个方面的问题:(1)能量的复杂性。(2)能量模型的高维特性。(3)能量模型的不精确性。目前,我们还远远无法构建起能引导目标序列朝正确方向折叠的足够精确力场,导致数学上的最优解并不一定对应于目标蛋白的天然结构;此外,模型的不精确性也会导致无法对优化算法性能进行客观地分析。蛋白质构象空间优化的本质复杂性,使其成为蛋白质结构从头预测领域中一个极具挑战性的研究课题。为了能够利用计算机在巨大的采样空间中发现唯一的蛋白质天然结构,就必须设计高效的构象空间优化算法将其转化为可实际操作的计算问题。差分进化算法(DE)由于其结构简单,易于实现,鲁棒性强和收敛速度快等优点已被成功应用于蛋白结构预测。然而,随着氨基酸序列的增长,蛋白质分子体系自由度也增大,利用传统群体算法采样获得大规模蛋白质构象空间的全局最优解成为一项挑战性的工作。因此,现有的蛋白质结构预测方法采样效率和预测精度方面存在不足,需要改进。
技术实现思路
为了克服现有的蛋白质结构预测方法采样效率低、种群多样性差、预测精度较低的不足,本专利技术在基本差分进化算法框架下,引入策略自适应的方法来指导构象空间优化,提出一种采样效率高、预测精度高的下界估计策略自适应蛋白质结构预测方法。本专利技术解决其技术问题所采用的技术方案是:一种下界估计策略自适应蛋白质结构预测方法,所述预测方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器(http://www.robetta.org/)上得到片段库文件,其中包括3片段库文件和9片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,学习周期LP,第一种变异策略被选择的概率第二种变异策略被选择的概率第三种变异策略被选择的概率第四种变异策略被选择的概率g表示当前的代数,策略数量k,第g代第k种策略成功次数置迭代代数g=0,斜率控制因子M;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)将每个构象Ci,i={1,2,…,NP}的每个碳α原子的三维坐标组合成该构象的位置坐标代表第i个构象的第一个碳α原子的三维坐标,L为蛋白质序列长度;6)对种群中的每个个体Ci进行如下操作:6.1)将Ci设为目标个体生成随机数pSelect,其中pSelect∈(0,1);6.2)若则从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为1;6.3)若则先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca、Cb和Cbest中随机选择一个位置不同的3片段,分别替换对应位置的片段生成变异构象Cmutant,并把k置为2;6.4)若则从种群中随机选出四个互不相同的个体Ca、Cb、Cc和Cd,分别从Cb、Cc、Cd中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为3;6.5)若则从种群中随机选出两个互不相同的个体Ca和Cb,分别从Ca、Cb中随机选择一个位置不同的3片段,分别替换对应的位置片段生成变异构象Cmutant,并把k置为4;6.6)对Cmutant进行一次片段组装生成新构象Cmutant′;6.7)生成随机数pCR,其中pCR∈(0,1),若pCR<CR,则从中随机选择一个3片段,替换到Cmutant′对应的位置的片段生成测试构象Ctrial,否则直接把Cmutant′记为Ctrial;6.8)从种群中找出距离Ctrial最近的个体Cnear,将对应构象每个碳α原子的三维坐标组合成该构象的位置坐标,则Ctrial和Cnear的位置坐标分别为6.9)若g=0,则用Rosettascore3能量函数计算Ctrial、Cnear的能量score3(Ctrial)、score3(Cnear),用公式(1)、(2)计算M和Mi,Mi表示由第i个构象计算出的斜率控制因子,分别是Xnear、Xtrial第j维坐标;6.10)如果则Ctrial替换否则按照概率以蒙特卡洛准则接收构象,若接收构象,则6.11)若g>0,用公式(3)计算Ctrial的下界估计UEtrial;如果则Ctrial被拒绝,否则由公式(1)、(2)计算M,并且如果则Ctrial替换否则按照概率以蒙特卡洛准则接收构象,若接收构象,则7)当g>0时,由公式(4)计算参数Mg,Mg表示第g代的M,表示第g代计算出的Mg集合里第i个常量M,n为集合的大小,操作如下:如果Mg<Mg-1,则M=Mg;8)当g>LP时,根据公式(5)更新变异策略选择的概率c是一个很小的常数:9)g=g+1,迭代运行步骤5)~9),至g>G为止;10)输出能量最低的构象为最终结果。本专利技术的技术构思为:在进化算法框架下,首先,种群初始化,根据轮盘赌的方法选择不同的策略对构象进行变异,交叉;其次根据下界估计函数,Rosetta能量函数score3、以及蒙特卡洛概率接收准则对构象进行选择,来指导构象的更新过程,根据构象更新的历史信息动态更新策略选择概率,下界估计策略自适应蛋白质结构预测方法不仅能够缓解能量函数不精确的问题,而且可以根据历史信息引导算法采样得到能量更低且结构更合理的构象,同时提高采样效率。本专利技术提供一种下界估计策略自适应蛋白质结构预测方法。本专利技术的有益效果为:根据种群更新的历史信息,通过轮盘赌的方法来选择变异策略指导变异,不仅能够提高采样效率,而且能够保持种群多样性;使用下界估计辅助构象选择,提高优化效率,同时缓解了能量函数不精确导致的预测误差问题,进而提高预测精度。附图说明图1是下界估计策略自适应蛋白质结构预测方法对蛋白质2LZMA采样得到的构象分布图。图2是下界估计策略自适应蛋白质结构预测方法对蛋白质2LZMA采样时的构象更新示意图。图3是下界估计策略自适应蛋白质结构预测方法对蛋白质2LZMA结构预测得到的三维结构。具体实施方式下面结合附图对本专利技术作进一步描述。参照图1~图3,一种下界估计策略自适应蛋白质结构预测方法,所述预测方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器(http://www.robetta.org/)上本文档来自技高网
...

【技术保护点】
1.一种下界估计策略自适应蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,学习周期LP,第一种变异策略被选择的概率

【技术特征摘要】
1.一种下界估计策略自适应蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)给定目标蛋白的序列信息;2)根据目标蛋白序列从ROBETTA服务器上得到片段库文件,其中包括3片段库文件和9片段库文件;3)设置参数:种群大小NP,算法的最大迭代代数G,交叉因子CR,温度因子β,学习周期LP,第一种变异策略被选择的概率第二种变异策略被选择的概率第三种变异策略被选择的概率第四种变异策略被选择的概率g表示当前的代数,策略数量k,第g代第k种策略成功次数置迭代代数g=0,斜率控制因子M;4)种群初始化:随机片段组装生成NP个初始构象Ci,i={1,2,…,NP};5)将每个构象Ci,i={1,2,…,NP}的每个碳α原子的三维坐标组合成该构象的位置坐标代表第i个构象的第一个碳α原子的三维坐标,L为蛋白质序列长度;6)对种群中的每个个体Ci进行如下操作:6.1)将Ci设为目标个体生成随机数pSelect,其中pSelect∈(0,1);6.2)若则从种群中随机选出三个互不相同的个体Ca、Cb和Cc,分别从Cb、Cc中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为1;6.3)若则先从种群中选择一个能量最低的个体Cbest,再从种群中随机选出两个互不相同的个体Ca、Cb,分别从Ca、Cb和Cbest中随机选择一个位置不同的3片段,分别替换对应位置的片段生成变异构象Cmutant,并把k置为2;6.4)若则从种群中随机选出四个互不相同的个体Ca、Cb、Cc和Cd,分别从Cb、Cc、Cd中随机选择一个位置不同的3片段,分别替换Ca对应位置的片段生成变异构象Cmutant,并把k置为3;6.5)若则从种群中随机选出两个互不相同的个体Ca和...

【专利技术属性】
技术研发人员:张贵军彭春祥刘俊周晓根王柳静胡俊
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1