基于差分进化和构象空间退火的蛋白质三维结构预测方法技术

技术编号:9490215 阅读:167 留言:0更新日期:2013-12-26 00:00
针对蛋白质三维结构预测这个高维复杂的优化问题,本发明专利技术提出了一种综合差分进化算法和构象空间退火算法的一种蛋白质三维结构预测方法,将差分进化算法融入到构象空间退火算法中,形成混合优化算法。在构象空间退火算法的框架下,差分进化算法能够很好的提高种群的多样性,同时差分进化算法中的全局优化因子能够增加种群竞争,提高了算法的收敛能力。仿真结果表明,该方法具有较好的收敛性能和预测精度,能够有效的找到脑啡肽的全局能量最小对应的结构。

【技术实现步骤摘要】
【专利摘要】针对蛋白质三维结构预测这个高维复杂的优化问题,本专利技术提出了一种综合差分进化算法和构象空间退火算法的一种蛋白质三维结构预测方法,将差分进化算法融入到构象空间退火算法中,形成混合优化算法。在构象空间退火算法的框架下,差分进化算法能够很好的提高种群的多样性,同时差分进化算法中的全局优化因子能够增加种群竞争,提高了算法的收敛能力。仿真结果表明,该方法具有较好的收敛性能和预测精度,能够有效的找到脑啡肽的全局能量最小对应的结构。【专利说明】
本专利技术涉及蛋白质三维结构预测
,特别涉及一种基于差分进化和构象空间退火相结合的一种蛋白质三维结构预测方法,属于将现代智能优化方法应用到蛋白质三维结构的工程预测方法。
技术介绍
随着人类基因组计划的完成和蛋白质的研究日益深入,在当今分子生物学领域中,蛋白质分子空间结构与功能的研究无疑是最具有挑战性的问题。三联密码的破译使人们掌握了遗传信息从DNA到氨基酸序列的复制规律,然而仅有氨基酸序列是不够的,氨基酸序列还必须形成一定的空间结构,才真正完成了蛋白质的合成,也才能行使其特定的生物功能,因此蛋白质结构的确定将是研究其生物功能的基础。同时蛋白质结构预测对于全新蛋白质分子设计、药物分子设计、生物和化学催化剂、光能-化学能-动能的转换、生物传感器、以及环境科学等许多领域都有深远的意义。特别是随着2000年基因组工作草图的完成,基因组的工作重心已经从测序转向了基因功能的识别,这一问题的解决显得尤为重要。人们通过研究蛋白质的内在结构来了解其内在机理,并找出蛋白质折叠的真正驱动力,这样可以按照人们的设想设计出符合特定需求的非天然蛋白质,对疾病进行有效的预测和控制。然而蛋白质结构的测定远远赶不上基因组测序速度,X射线晶体学方法和多维核磁共振技术是目前测定蛋白质结构的主要物理方法。用X射线晶体学方法测定蛋白质结构不仅需要花相当长的时间,在技术上也受到相当大的限制;多维核磁共振技术能够有效测定蛋白质的结构,但仅适用于小蛋白。因此,单纯依靠试验方法测定所有蛋白质的空间结构远远不能满足后基因时代对于蛋白质数据分析的需求,有必要发展一种可靠的理论预测方法,从而迅速、简便的获取蛋白质的结构信息。早在1961年,Anfinsen提出蛋白质一级结构完全决定其空间结构的著名论断,并因此获得诺贝尔奖,从此揭开了理论预测蛋白质结构的序幕。解决蛋白质空间结构预测问题可以分为三部曲:即首先进行形式化,将蛋白质结构抽象转化成一个数学模型;然后分析模型的可计算性;最后进行算法设计,从算法的时间和空间复杂度出发,寻找最优算法。理论计算方法(也称热力学方法)是一种常用的蛋白质结构预测方法,由于它仅利用一级序列信息进行预测,而不需要任何其他已知蛋白质结构信息,所以该方法是比较理想的预测方法。其基本假设是:一定环境中的天然蛋白质的三维结构是整个系统自由能最小的结构。要实现这一方法有两个关键:一是要有一个合理的势函数,势函数的全局极小值对应蛋白质的天然结构;二是要有个好的算法,保证在有效的计算时间找到势能函数的全局最小。目前,根据Anfinsen假设,直接从氨基酸序列出发,基于分子力场势能模型,采用全局优化方法,在其势能面上搜索蛋白质分子系统的最小能量状态,从而能够高通量、廉价地预测肽链的天然构像,已经成为生物信息学最重要的研究课题之一。由于蛋白质是一种强柔性的大分子体系,其势函数表达式极其复杂,存在极多局部极小点。据估计,N个残基的氨基酸序列,其局部极小点在IOn以上,而迄今发现的蛋白质中肽链平均含300-500个氨基酸残基,所以有效解决全局优化问题是蛋白质结构预测中的一个关键。近年来,许多随机全局优化算法陆续提出来解决蛋白质三维结构预测问题,如遗传算法、差分进化算法、构象空间退火算法。差分进化算法虽然具有较强的全局搜索能力和求解问题的能力,还具有简单、通用和并行处理等特点。但是用差分进化这种群体优化算法处理多模态优化问题时,由于使用了全局选择因子,算法只能收敛到全局最优解,而忽略了众多局部极值解;其次,模型的复杂性造成这些算法极易陷入某个局优解;同时差分这种随机算法缺乏全局收敛理论依据及解的不确定性,进一步限制了它们在实际问题中的应用。构象空间退火算法结合了遗传算法、模拟退火等算法的优点,具有很好的搜索全局最优的能力。在构象空间退火法中,首先以一组随机选择的蛋白质构象开始,然后对这些构想进行能量极小化,所得到的局部最小蛋白质构象作为种群库中的新成员,这些构象要求是随机分布的,并且在相互独立的条件下进一步被优化,以覆盖种群库中尽可能大的区域。单种智能算法总存在一些算法固有的缺点,而将两种或多种智能算法按照某种规则融合在一起或在单种智能算法中引入其他优化思想,形成混合优化算法,则可以有效地扬长避短,发挥智能算法的优点,大大提高算法的全局和局部收敛能力。构象空间退火法虽然能够很好的解决蛋白质三维结构预测问题,但是由于蛋白质结构极其复杂,其势能函数曲面分布大量的局部极值点,而构象空间退火算法优化种群较小,优化过程中种群多样性较小,同时种群缺乏竞争机制,所以算法容易陷入局部极值解。
技术实现思路
本专利技术针对现有的蛋白质三维结构预 测在采用单一现代进化算法时,容易陷入极小值、预测效率差等缺点,提出了一种综合构象空间退火算法和差分进化算法的一种蛋白质三维结构预测方法。实现本专利技术而采取的技术方案概括如下:1、选择优化目标,即蛋白质力场模型函数E⑴。2、初始化进化种群:随机产生Nbank个蛋白质结构作为初始种群Ρ0Ρ,同时设定算法各参数,并使用拟牛顿法对初始种群进行能量极小化处理。3、将处理过的Nbank个蛋白质个体作为初始种群库firstbank,并设定初始Dcut=l/2Dave 其中 D— = -τ;~~In Σ Σ Σ |,其中 i 关 j,Ndre 表示的是优化目标 ’iyBank \iybank ~l) i=l./=1 k=l的维数,名表示的是第i个蛋白质结构的第k个二面角。4、将firstbank中的个体直接复制给Bank中,并更新Bank中的个体。5、随机从Bank中选取M个个体作为种子,每个种子按照以下四种扰动策略产生10个新的个体,总共产生M*10个新个体。同时检查Bank中的个体是否全部都作为过种子,若库中的个体全部做过种子,而循环仍然没有结束,则重新随机产生Nbank个蛋白质结构加入Bank 中。5.1以基本差分进化算法中变异操作产生3个新的蛋白质结构,其中具体操作公式为:u = xa+F.(xb-xc) a ^ b ^ c,其中公式中基准矢量Xa为种子个体;个体Xb和X。是随机从Bank中选取的蛋白质结构,F为变异因子。5.2以改进差分进化算法中变异操作产生3个新的蛋白质结构,其中具体操作公式为:u = Xbest+F.(xb-xc) best关b关c,其中Xbest是Bank库中能量最低个体;xb和Xc是随机从Bank中选取的蛋白质结构,F为变异因子。5.3随机选取一种蛋白质结构片段(小组),同时随机从M个种子中和Bank中各选取一个种子和待测试个体,将待测试个体中和小组相对应的局部片段直接复制给种子相应的片段。以这种扰动策略产生2个新的蛋白质结构。5.4随机选取一种蛋白质本文档来自技高网
...

【技术保护点】
一种基于混合优化算法的蛋白质三维结构预测方法,其特征是:在构象空间退火算法的基础上,综合了差分进化算法,引入了几种不同的种子扰动策略,对蛋白质三维结构进行优化搜索,具体实现如下:1)、选择优化目标,确定蛋白质的力场模型函数E(X);2)、初始化进化种群:随机产生Nbank个蛋白质结构作为初始种群POP,同时设定算法各参数,并使用拟牛顿法对初始种群进行能量极小化处理;3)、将处理过的Nbank个蛋白质个体作为初始种群库firstbank,并设定初始Dcut=1/2Dave,其中Dave=1Nbank*(Nbank-1)Σi=1NbankΣj=1NbankΣk=1Ndire|θki-θkj|,其中i≠j,Ndre表示的是优化目标的维数,表示的是第i个蛋白质结构的第k个二面角;4)、将firstbank中的个体直接复制给Bank中,并更新Bank中的个体;5)、随机从Bank中选取M个个体作为种子,每个种子以不同的扰动策略产生10个新的个体,总共产生M*10个新个体;同时在循环过程中检查Bank中的个体是否全部都作为过种子,若库中的个体全部做过种子,而算法循环仍然未结束,则重新随机产生Nbank个蛋白质结构加入Bank中;6)、将新产生的个体经拟牛顿法进行能量极小化处理,然后将这些新产生的蛋白质结构更新给Bank各种子生境中,其中更新的具体操作:6.1)通过计算新产生个体B和Bank中的种子A之间的距离d(A,B),再将d(A,B)和Dcut进行比较,其中表示的是蛋白质结构A的第s个二面角,Ndre表示的是优化目标的维数;6.2)若d(A,B)...

【技术特征摘要】

【专利技术属性】
技术研发人员:张贵军程正华姚春龙邓勇跃周晓根陈先跑
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1