一种基于片段自适应选择的群体蛋白质结构预测方法技术

技术编号:20450116 阅读:55 留言:0更新日期:2019-02-27 03:40
一种基于片段自适应选择的群体蛋白质结构预测方法,在差分进化算法框架下,针对每一代的构象,首先从当前种群中选择能量最低的构象,通过对其每个残基位进行多次组装来学习每个残基位和对应的片段库中每个片段的成功率,并根据前一代的成功信息来计算每个残基位和对应的片段库中每个片段的选择概率;在变异和组装过程中,根据这些概率去确定残基位以及从对应的片段库中选择片段,从而保证成功率较高的残基位和成功率较高的片段被选择的概率较大,进而提高预测精度。本发明专利技术提供一种预测精度较高的基于片段自适应选择的群体蛋白质结构预测方法。

【技术实现步骤摘要】
一种基于片段自适应选择的群体蛋白质结构预测方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是一种基于片段自适应选择的群体蛋白质结构预测方法。
技术介绍
蛋白质结构实验测定是结构基因组学研究的主要内容,主要包括X射线晶体衍射和多维核磁共振(NMR)两种方法。X射线晶体衍射是目前测定蛋白质结构最有效的方法,所能达到的精度是其它方法所不能比拟的,主要缺点是蛋白质晶体难以培养且晶体结构测定的周期较长;NMR方法可以直接测定蛋白质在溶液中的构象,但是对样品的需求量大、纯度要求高,目前只能测定小分子蛋白质的结构。现阶段实验测定方法主要问题在于两个方面:一方面,对于现代药物设计的主要靶标—膜蛋白而言,极难获得其结构;另外,实验测定过程费时费钱费力,代价不菲。蛋白质结构从头预测直接基于蛋白质物理化学或知识能量模型,利用优化算法在构象空间搜索全局最低能量构象解。计算机硬件和软件技术的快速发展,为蛋白质结构从头预测提供了坚实的基础平台条件。IBM超级计算机蓝色基因(BlueGene)、Shaw研究团队超级计算机ANTON、华盛顿大学分布式网络计算平台Rosetta@home、斯本文档来自技高网...

【技术保护点】
1.一种基于片段自适应选择的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;2)参数设置:设置种群规模NP,交叉概率CR,片段长度l,温度因子KT,最大迭代次数Gmax,选择概率更新因子k,初始化迭代次数g=0,并设置残基位的组装次数N,第j个残基位在第g代中的选择概率

【技术特征摘要】
1.一种基于片段自适应选择的群体蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入待测蛋白质的序列信息,并从ROBETTA服务器上得到片段库;2)参数设置:设置种群规模NP,交叉概率CR,片段长度l,温度因子KT,最大迭代次数Gmax,选择概率更新因子k,初始化迭代次数g=0,并设置残基位的组装次数N,第j个残基位在第g代中的选择概率第j个残基位的片段库中第m个片段在第g代的选择概率j=1,2,...,L,其中S为片段库中片段的数量,L为序列长度;3)从各残基位对应的片段库中随机选择片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci,i={1,2,…,NP}为种群P中的第i个构象个体;4)根据RosettaScore3计算当前种群中每个构象个体的能量值;5)选择当前种群中能量最低的构象,并对其各残基位随机片段组装N次,并记录每个残基位组装成功的次数,以及每个残基位的片段库中每个片段的成功次数和总使用次数,其中,用Rosettasocre3能量函数计算组装前后构象的能量,如果能量降低,则表示组装成功;6)用每个残基位组装成功的次数除以总组装次数N得到该残基位的组装成功率sj,j=1,2,...,L,并用每个残基位的片段库中的每个片段的成功次数除以总使用次数得到每个片段的成功率7)如果g>0,计算每个残基位的选择概率并对其进行归一化得到归一化选择概率同时,如果则计算第j个残基位的片段库中的第m个片段的成功率8)对种群中的每个构象Ci,i∈{1,2,…,NP}执行如下操作:8.1)将构象Ci看...

【专利技术属性】
技术研发人员:周晓根张贵军彭春祥刘俊胡俊
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1