一种局部增强的差分进化蛋白质构象空间搜索方法技术

技术编号:12101075 阅读:133 留言:0更新日期:2015-09-23 19:09
一种局部增强的差分进化蛋白质构象空间搜索方法,包括以下步骤:给定输入序列,设置系统参数:种群大小,迭代次数,交叉因子,片段长度;对种群中的每个个体进行完全的片段组装,生成初始种群;依次对初始种群中的每一个个体,执行变异、交叉、选择操作对种群进行更新,得到更新种群;对更新种群中的每个个体调用Monte Carlo方法进行局部增强,按照设定的玻尔兹曼接收概率接收增强的个体,得到增强的种群;迭代的运行以上步骤,至达到终止条件。本发明专利技术有效降低构象空间搜索维数、提高算法的收敛速度、有效提高预测精度,可以对构象空间进行更为有效的采样。

【技术实现步骤摘要】

本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种局部增强的差分进 化蛋白质构象空间搜索方法。
技术介绍
蛋白质分子在生物细胞化学反应过程中起着至关重要的作用。它们的结构模型和 生物活性状态对我们理解和治愈多种疾病有重要的意义。蛋白质只有折叠成特定的三维结 构才能产生其特有的生物学功能。因此,要了解蛋白质的功能,就必须获得其三维空间结 构。 蛋白质结构预测问题自上世纪50年代以来就一直备受关注,尤其是从头预测构 象空间优化方法,是生物信息学和计算生物学领域的热点研宄课题,因为蛋白质的三维空 间结构决定了它所承载的生物功能,想要了解其功能进而对许多由蛋白质结构改变而引起 的疾病进行有效的控制和预防,就必须获得其三维结构。从头预测方法直接从蛋白质的氨 基酸序列出发,根据Anfinsen原则,以计算机为工具,运用适当算法,通过计算得到蛋白质 的天然构象,适用于同源性小于25%的大多数蛋白质。而制约从头预测方法预测精度的瓶 颈因素主要有两个方面:第一,蛋白质构象空间的高维复杂性以及能量表面的粗糙性,使其 成为一个难解的NP-Hard问题;第二,力场模型的不精确性也使得预测结果难以达到较高 的精度。设计有效的算法增强对构象空间的采样是解决蛋白质结构从头预测瓶颈问题的有 效途径。但是到目前还没有一种十分完善的方法来预测蛋白质的三维结构,即使获得了很 好的预测结果,但也只是针对某些蛋白质而言的,目前主要的技术瓶颈在于两个方面,第一 方面在于采样方法,现有技术对构象空间采样能力不强,另一方面在于构象更新方法,现有 技术对构象的更新精度仍然不足。 因此,现有的构象空间搜索方法存在不足,需要改进。
技术实现思路
为了克服现有蛋白质结构预测方法的构象空间搜索维数较高、收敛速度较慢、预 测精度较低的不足,本专利技术基于差分进化算法,提出一种局部增强的差分进化蛋白质构象 空间搜索方法,LEDE :在差分进化算法框架下,采用Rosetta Score3粗粒度知识能量模型 来;引入基于知识的片段组装技术可以有效提高预测精度;利用Monte Carlo算法良好的 局部搜索性能对种群做局部增强,以得到更为优良的局部构象,结合差分进化算法较强的 全局搜索能力,可以对构象空间进行更为有效的采样。 本专利技术解决其技术问题所采用的技术方案是: -种局部增强的差分进化蛋白质构象空间搜索方法,包括以下步骤: 1)给定输入序列信息; 2)设置系统参数:种群大小popSize,算法的迭代次数T,交叉因子CR,片段的长度 L; 3)种群初始化:由输入序列产生popSize个种群个体Pinit; 4)开始迭代,执行种群更新过程,对初始种群中的每个个体: 4. 1)设 i = 1,其中 i G {1,2,3,…,popSize};令Ptarget=Pi,其中 i 为序号,Ptarget 表示目标个体; 4.2)随机生成正整数 randl,rand2,rand3,其中 randlG{1, 2, 3,......popSize}, randl ^ i, rand2 ^ rand3,G{1, 2, ???,Length},Length 为序列长度; 4. 3)针对个体 Pj做变异操作,其中:j = randl ;令 a = min (rand2, rand3),b = max (rand2, rand3),k G ; 4. 4)对蛋白质链中第a到b个氨基酸做如下操作: a :令Ptarget.phi(k) =Pj.phi(k); b:令Ptarget.psi(k) =Pj.psi(k); c :令 Ptarget. omega (k) = Pj. omega (k); 步骤a,b,c分别为:将Ptmget的氨基酸k所对应的二面角phi、psi、omega替换为 Pj的相同位置所对应的二面角phi、psi、omega ; 4. 5)通过变异得到测试个体Ptrial; 4. 6)生成随机数 rand4, rand5,其中 rand4 G (0, 1),rand5 G (1,Length); 4. 7)根据 执行交叉过程:若随机数 rand4〈 = CR,个体PtHal的片段rand5替换为个体Pta,get中对应的片段,否则直接继承个体 Ptrial。 4. 8)根据 Rosetta Score3 计算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial); 4. 9)若E(Ptmget)>E(PtHal)则用Ptaial替换Ptmget,否则保持种群不变; 5)得到更新种群Pupdate; 6)对更新种群中的每个个体Pi: 6. 1)调用Monte Carlo方法对个体做局部增强; 6. 2)计算增强过程中产生的构象的能量E(MC); 6. 3)若E的)>E(MC),则更新种群,否则保持种群不变; 7)得到局部增强后的种群Penhanc;e; 8)迭代的运行步骤4)~7),至终止条件。 本专利技术的有益效果为:在差分进化算法框架下,采用Rosetta Score3粗粒度知识 能量模型有效降低构象空间搜索维数、提高算法收敛速度;引入基于知识的片段组装技术 可以有效提高预测精度;利用Monte Carlo算法良好的局部搜索性能对种群做局部增强, 以得到更为优良的局部构象;结合差分进化算法较强的全局搜索能力,可以对构象空间进 行更为有效的采样,搜索得到较高精度的近天然态构象。【附图说明】图1是蛋白质1ENH构象系综中构象更新示意图。【具体实施方式】 下面结合附图对本专利技术作进一步描述。 参照图1,,包括以下步骤: 1)给定输入序列信息; 2)设置系统参数:种群大小popSize,算法的迭代次数T,交叉因子CR,片段的长度 L ; 3)种群初始化:由输入序列产生popSize个种群个体Pinit; 4)开始迭代,执行种群更新过程,对初始种群中的每个个体: 4. 1)设 i = 1,其中 i G {1,2,3,…,popSize};令Ptarget=Pi,其中 i 为序号,Ptarget 表示目标个体; 4.2)随机生成正整数 randl,rand2,rand3,其中 randlG{1, 2, 3,......popSize}, randl ^ i, rand2 ^ rand3,G{1, 2, ???,Length},Length 为序列长度;4. 3)针对个体 Pj做变异操作,其中:j=randl;令 a = min (rand2, rand3),b = max (rand2, rand3),k G ; 4. 4)对蛋白质链中第a到b个氨基酸做如下操作: a :令Ptarget. phi(k) =Pj.phi(k); b :令Ptarget. psi(k) =Pj.psi(k); c :令Ptarget. omega(k) =Pj.omega(k); 步骤a,b,c分别为:将Ptmget的氨基酸k所对应的二面角phi、psi、omega替换为 Pj的相同位置所对应的二面角phi、psi、omega; 4. 5)通过变异得到测试个体Ptrial; 4. 6)生成随机数 rand4, rand5,其中 rand4 G本文档来自技高网
...
一种局部增强的差分进化蛋白质构象空间搜索方法

【技术保护点】
一种局部增强的差分进化蛋白质构象空间搜索方法,其特征在于:所述构象空间搜索方法包括以下步骤:1)给定输入序列信息;2)设置系统参数:种群大小popSize,算法的迭代次数T,交叉因子CR,片段的长度L;3)种群初始化:由输入序列产生popSize个种群个体Pinit;4)开始迭代,执行种群更新过程,对初始种群中的每个个体:4.1)设i=1,其中i∈{1,2,3,…,popSize};令Ptarget=Pi,其中i为序号,Ptarget表示目标个体;4.2)随机生成正整数rand1,rand2,rand3,其中rand1∈{1,2,3,......popSize},rand1≠i,rand2≠rand3,∈{1,2,…,Length},Length为序列长度;4.3)针对个体Pj做变异操作,其中:j=rand1;令a=min(rand2,rand3),b=max(rand2,rand3),k∈[a,b];4.4)对蛋白质链中第a到b个氨基酸做如下操作:a:令Ptarget.phi(k)=Pj.phi(k);b:令Ptarget.psi(k)=Pj.psi(k);c:令Ptarget.omega(k)=Pj.omega(k);步骤a,b,c分别为:将Ptarget的氨基酸k所对应的二面角phi、psi、omega替换为Pj的相同位置所对应的二面角phi、psi、omega;4.5)通过变异得到测试个体Ptrial;4.6)生成随机数rand4,rand5,其中rand4∈(0,1),rand5∈(1,Length);4.7)根据Ptrail=Ptrail,rand5=Ptarget,rand5if(rand4≤CR)Ptrail,rand5otherwise]]>执行交叉过程:若随机数rand4<=CR,个体Ptrial的片段rand5替换为个体Ptarget中对应的片段,否则直接继承个体Ptrial;4.8)根据Rosetta Score3计算Ptarget和Ptrial的能量:E(Ptarget)和E(Ptrial);4.9)若E(Ptarget)>E(Ptrial)则用Ptrial替换Ptarget,否则保持种群不变;5)得到更新种群Pupdate;6)对更新种群中的每个个体Pi:6.1)调用Monte Carlo方法对个体做局部增强;6.2)计算增强过程中产生的构象的能量E(MC);6.3)若E(Pi)>E(MC),则更新种群,否则保持种群不变;7)得到局部增强后的种群Penhance;8)迭代的运行步骤4)~7),至终止条件。...

【技术特征摘要】

【专利技术属性】
技术研发人员:张贵军郝小虎俞旭锋周晓根陈凯徐东伟
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1