一种基于差分进化局部扰动的蛋白质构象空间优化方法技术

技术编号:20392647 阅读:18 留言:0更新日期:2019-02-20 03:58
一种基于差分进化局部扰动的蛋白质构象空间优化方法,在差分进化算法的框架下,利用种群中个体间的信息交换增强算法的探索能力;同时,利用差分进化算法实现对loop区域的微调,增加loop区域结构的多样性,从而在已有的结构的基础上进一步增强对loop区域的探索,进而提高整体的探索效率和预测精度。本发明专利技术提供一种预测精度较高的基于差分进化局部扰动的蛋白质构象空间优化方法。

【技术实现步骤摘要】
一种基于差分进化局部扰动的蛋白质构象空间优化方法
本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种基于差分进化局部扰动的蛋白质构象空间优化方法。
技术介绍
蛋白质是以氨基酸为基本单位构成的生物大分子。蛋白质是生命的物质基础,是构成细胞的基本有机物。生物体内的氨基酸种类有20种,20种氨基酸排列组合形成了各种各样具有特定功能的蛋白质。蛋白质的功能由其空间结构决定,许多疾病就是由于蛋白质的空间结构发生变化导致的。因此,确定蛋白质的空间结构将有助于相关疾病的治疗。由于通过实验测定蛋白质三维结构的方法存在局限,因此利用计算机技术根据蛋白质的氨基酸序列预测蛋白质的三维结构成为测定蛋白质空间结构的另一种选择。根据氨基酸序列预测蛋白质三维结构的方法主要分为同源建模法和从头预测法。其中从头预测法不依赖目标蛋白的同源信息。目前比较成功的从头蛋白质结构预测方法有Baker团队开发的Rosetta和张阳团队开发的QUARK等。根据氨基酸序列预测蛋白质三维结构实质上是在能量模型引导下的构象空间优化问题。目前的构象空间优化方法对α螺旋和β折叠的探索能力较强,往往能形成较高精度的α螺旋和β折叠;但是这些方法对loop区域的探索能力不够,不能形成很好的loop结构,从而影响整体的预测精度。因此,目前的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,需要改进。
技术实现思路
为了克服现有的构象空间优化方法对loop区域的探索存在搜索效率低和预测精度不足等问题,本专利技术提供一种预测精度较高的一种基于差分进化局部扰动的蛋白质构象空间优化方法,本方法在大规模搜索构象空间的同时增强对loop区域的探索,利用差分进化算法实现对loop区域的扰动,从而提高loop区域结构的多样性,在已有结构的基础上进一步优化loop区域的结构,从而提高整体的预测精度。本专利技术解决其技术问题所采用的技术方案是:一种基于差分进化局部扰动的蛋白质构象空间优化方法,所述方法包括以下步骤:1)输入预测蛋白质的序列信息;2)设置参数,过程如下:2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};4)设g=1,其中g∈{1,2,...,G};5)设n=1,其中n∈{1,2,...,NP};6)变异操作,过程如下:6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;7)交叉操作,过程如下:7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;10)对Passem的[b,e]区域进行局部扰动,过程如下:10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};10.4)模型评估,过程如下:10.4.1)将X中的旋转点χk依次按照旋转角φs绕旋转轴ws旋转,其中k∈{1,2,...,K},s∈{S,S-1,...,1};得到旋转后的X′={χ′1,χ′2,...,χ′K},χ′k=(x′k,y′k,z′k);10.4.2)打分函数,按如下公式计算Φ对应的得分:10.5)求解最优的Φ,使其得分最低,过程如下:10.5.1)初始化:生成初始种群Γ={Φ1,Φ2,...,ΦNP′},其中10.5.2)设g′=1,其中g′∈{1,2,...,G′};10.5.3)设n′=1,其中n′∈{1,2,...,NP′};10.5.4)变异操作,过程如下:10.5.4.1)从种群Γ中选择得分最低的个体,记作Φbest;再随机选择两个互不相同且与Φbest不同的个体,记作Φselect1、Φselect2;10.5.4.2)按如下方式生成变异后的个体Φmutate:10.5.5)交叉操作,过程如下:10.5.5.1)在[1,S]内生成均匀随机整数srand;10.5.5.2)生成S个均匀随机小数Rs,Rs∈[0,1],s∈{1,2,...,S};10.5.5.3)按如下方式生成交叉后的个体Φcross:10.5.6)选择操作,过程如下:10.5.6.1)根据步骤10.4)计算Φn′和Φcross的得分Dn′和Dcross;10.5.6.2)若Ecross<En′,用Φcross替换种群Γ中的个体Φn′;10.5.7)n′=n′+1;若n′≤NP′,转至步骤10.5.4);10.5.8)g′=g′+1;若g′≤G′,转至步骤10.5.3);10.5.9)从种群中选择五个能量最低的个体作为候选扰动角度,记作H={Φ1,Φ2,Φ3,Φ4,Φ5};10.6)选择扰动,过程如下:10.6.1)设i=1,其中i∈{1,2,3,4,5};10.6.2)将H中的第i个个体Φi的扰动角度添加到Passem对应的二面角上,形成扰动后的个体Pperturb;10.6.3)用Rosettascore3能量函数计算Passem和Pperturb的能量Eassem和Eperturb,并按照如下公式计算接收扰动的概率:10.6.4)生成均匀随机小数rand4,rand4∈[0,1];若pacc<rand4,令Ptrial=Pperturb,转至步骤11);否则,转至步骤10.6.5);10.6.5)i=i+1;若i≤5,转至步骤10.6.2);否则,令Ptrial=Passem;11)用Rosettascore3能量函数计算Ptrial和Pn的能本文档来自技高网...

【技术保护点】
1.一种基于差分进化局部扰动的蛋白质构象空间优化方法,其特征在于,所述构象空间优化方法包括以下步骤:1)输入预测蛋白质的序列信息;2)设置参数,过程如下:2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};4)设g=1,其中g∈{1,2,...,G};5)设n=1,其中n∈{1,2,...,NP};6)变异操作,过程如下:6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;6.2)在[0,L‑3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;7)交叉操作,过程如下:7.1)在[0,L‑3]内生成与rand1和rand2不同的均匀随机整数rand3;7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;10)对Passem的[b,e]区域进行局部扰动,过程如下:10.1)以P...

【技术特征摘要】
1.一种基于差分进化局部扰动的蛋白质构象空间优化方法,其特征在于,所述构象空间优化方法包括以下步骤:1)输入预测蛋白质的序列信息;2)设置参数,过程如下:2.1)构象搜索差分进化参数:种群规模NP,迭代次数G;2.2)二面角扰动差分进化参数:种群规模NP′,迭代次数G′,交叉概率CR,变异算子F;3)种群初始化:迭代Rosetta协议第一、二、三阶段,产生具有NP个个体的种群P={P1,P2,...,PNP},其中Pn表示种群P中的第n个个体,n∈{1,2,...,NP};4)设g=1,其中g∈{1,2,...,G};5)设n=1,其中n∈{1,2,...,NP};6)变异操作,过程如下:6.1)从种群P中随机选择三个互不相同的个体Pselect1、Pselect2、Pselect3;6.2)在[0,L-3]内生成两个不同的均匀随机整数rand1和rand2,其中L表示氨基酸序列的长度;6.3)将Pselect1的第rand1至rand1+2号残基的二面角值替换成Pselect2对应残基的二面角值,将Pselect1的第rand2至rand2+2号残基的二面角值替换成Pselect3对应残基的二面角值,形成变异后的个体Pmutate;7)交叉操作,过程如下:7.1)在[0,L-3]内生成与rand1和rand2不同的均匀随机整数rand3;7.2)将Pmutate的第rand3至rand3+2号残基的二面角值替换成Pn对应残基的二面角值,形成交叉后的个体Pcross;8)利用Psipred算法获取Pcross的二级结构信息,随机选择一段二级结构为loop且长度大于4的区域,记作[b,e],其中b和e分别表示该区域第一个残基和最后一个残基的残基号;9)利用Rosetta协议第四阶段使用的片段组装技术对Pcross的[b,e]区域执行一次片段组装,得到片段组装后的个体Passem;10)对Passem的[b,e]区域进行局部扰动,过程如下:10.1)以Passem第b至e号残基二面角和ψ对应的键作为旋转轴,取键方向上的单位向量得到旋转轴坐标,记作Ω={ω1,ω2,...,ωS},其中S表示旋转轴数量,ωs=(xs,ys,zs)表示第s个旋转轴的坐标,s∈{1,2,...,S};10.2)记旋转角度Φ={φ1,φ2,...,φS},其中φs表示第s个旋转轴对应的旋转角度,即Passem的[b,e]区域第s个二面角的扰动角度;10.3)以Passem第e至L号残基的Cα原子作为旋转点,记作X={χ1,χ2,...,χK},其中K表示旋转点数量,χk=(xk,yk,zk)表示第k个旋转点的坐标,k∈{1,2,...,K};10.4)模型评估,过程如下:10.4.1)将X中的旋转点χk依次按照...

【专利技术属性】
技术研发人员:张贵军刘俊彭春祥周晓根王柳静李远锋
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1