一种基于Loop信息采样的群体蛋白质构象空间优化方法技术

技术编号:19343040 阅读:33 留言:0更新日期:2018-11-07 14:13
一种基于Loop信息采样的群体蛋白质构象空间优化方法,首先,在群体算法中使用了针对Loop区域的交叉,交叉概率的设置可以控制群体收敛的速度,避免早熟;其次,二级结构区域片段组装操作可以使构象形成较优的整体拓扑结构;然后,使用基于Loop区域的拉氏图重要性采样方法对目标蛋白构象的Loop区域进行局部结构增强;最后,在选择过程中结合二级结构相似度和能量函数两个指标对种群进行择优,淘汰二级结构相似度较小和能量较大的个体,避免能量函数不精确的问题。本发明专利技术采样能力较好、预测精度较高。

A method for optimizing conformational space of population proteins based on Loop information sampling

A method of conformation space optimization for population proteins based on Loop information sampling is proposed. Firstly, crossover for Loop region is used in population algorithm. The setting of crossover probability can control the convergence speed of population and avoid premature maturity. Secondly, the assembly of secondary structure region fragments can make the conformation form a better overall topology. Secondly, the local structure of the Loop region is enhanced by Laplace map importance sampling method based on Loop region. Finally, in the selection process, two indicators, secondary structure similarity and energy function, are combined to optimize the population, eliminating individuals with smaller secondary structure similarity and larger energy, and avoiding them. The energy function is inaccurate. The invention has good sampling ability and high prediction accuracy.

【技术实现步骤摘要】
一种基于Loop信息采样的群体蛋白质构象空间优化方法
本专利技术是一种涉及生物学信息学、分子动力学模拟、统计学习与组合优化、计算机应用领域,具体涉及的是,一种基于Loop信息采样的群体蛋白质构象空间优化方法。
技术介绍
蛋白质是生物体中分布最广,最复杂的蛋白质,在与生命有关的各种过程中起着至关重要的作用,例如运输,调节和防御过程。蛋白质的结构可以分为三个层次:1)蛋白质的一级结构是指多肽链中的氨基酸序列。2)二级结构是指实际多肽主链上高度规则的局部结构。有二种主要类型的二级结构,α-螺旋和β-链。3)三级结构是指单体和多聚体蛋白质分子的三维结构。α-螺旋和β-折叠片被折叠成致密的球状结构。4)第四结构是由作为单一功能单位运行的两个或多个单独的多肽链(亚基)聚集组成的三维结构。蛋白质只有在折叠成特定结构后才能发挥某些生物学功能,因此理解蛋白质的结构对理解它是中枢神经系统非常重要,它的传染源是一种特定类型的被称为朊病毒的错误折叠蛋白质。在正常情况下,朊病毒是α-螺旋结构,但在特定情况下,它会扭曲成β链结构,这是致病因子。获得蛋白质三维结构的实验方法包括X射线晶体学,核磁共振波谱学,低温电本文档来自技高网...

【技术保护点】
1.一种基于Loop信息采样的群体蛋白质构象空间优化方法,其特征在于,所述方法包括以下步骤:1)设置种群规模N、迭代代数I、交叉概率R、初始化片段组装上限为Max,温度常数kT,读入目标蛋白序列,片段库信息,预测二级结构信息以及拉氏图信息;2)根据目标蛋白序列得到初始直链,并将初始直链复制形成规模为N大小的种群,用Rosetta协议的stage1对种群所有个体进行初始化,种群个体每个位置上的残基均被替换至少一次以上或达到Max次片段组装上限则视为初始化成功;3)种群交叉,过程如下:3.1)将种群个体随机配对,以交叉概率R判断是否进行交叉,若进行交叉,跳至步骤3.2),若不进行交叉,则跳至步骤4...

【技术特征摘要】
1.一种基于Loop信息采样的群体蛋白质构象空间优化方法,其特征在于,所述方法包括以下步骤:1)设置种群规模N、迭代代数I、交叉概率R、初始化片段组装上限为Max,温度常数kT,读入目标蛋白序列,片段库信息,预测二级结构信息以及拉氏图信息;2)根据目标蛋白序列得到初始直链,并将初始直链复制形成规模为N大小的种群,用Rosetta协议的stage1对种群所有个体进行初始化,种群个体每个位置上的残基均被替换至少一次以上或达到Max次片段组装上限则视为初始化成功;3)种群交叉,过程如下:3.1)将种群个体随机配对,以交叉概率R判断是否进行交叉,若进行交叉,跳至步骤3.2),若不进行交叉,则跳至步骤4)3.2)根据用户读入的目标蛋白预测二级结构,统计目标的Loop区域数量以及长度;3.3)随机选取目标蛋白的其中一个完整的Loop区域,然后交换两个候选个体该长度范围内所有残基的二面角信息;4)种群二级结构区域变异,对于种群个体i,二级结构区域变异过程如下:4.1)根据目标蛋白的Loop区域信息记录个体i的所有Loop区域的残基二面角信息;4.2)对个体进行9片段片段组装,生成个体i',若片段组装发生在非Loop区域,则用4.1)保存的残基二面角信息去替换个体i'中相应区域的二面角信息,即片段组装只会发生在Loop区域,非Loop区域的结构信息不会改变;4.3)用能量函数“score3”对变异前后个体i和i'进行能量评价,若能量变小,则接收变异后个体i',若能量变...

【专利技术属性】
技术研发人员:李章维孙科谢腾宇周晓根张贵军
申请(专利权)人:浙江工业大学
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1