当前位置: 首页 > 专利查询>湖南大学专利>正文

一种基于局部有偏的蛋白质结构预测方法技术

技术编号:26381331 阅读:28 留言:0更新日期:2020-11-19 23:50
本发明专利技术属于生物信息学、智能优化、计算机应用领域,公开了一种基于局部有偏的蛋白质结构预测方法。本发明专利技术包括步骤:计算目标个体变异窗口片段与片段库片段的疏水尺度差以及片段库中各片段的二级结构得分;对片段库中各片段统计并排序;选择最佳片段进行片段组装,通过蒙特卡洛机制判断是否接收以确定变异个体;计算变异个体与随机个体交叉片段的二级结构得分以确定交叉个体;通过随机数取值决定比较目标个体和交叉个体能量值或二级结构分数来选择下一代目标个体。本发明专利技术避免了传统构象空间优化方法的不足,如:采样效率低,预测精度较低。本发明专利技术借助于氨基酸疏水特性及其局部结构特征,实现了改进的结构模型评分方法。

【技术实现步骤摘要】
一种基于局部有偏的蛋白质结构预测方法
:本专利技术涉及生物信息学、智能优化、计算机应用领域,尤其涉及的是一种基于局部有偏的蛋白质结构预测方法。
技术介绍
:蛋白质三级结构预测是结构生物学领域主要的研究问题之一。蛋白质是由20种不同的氨基酸残基组成的长序列,在特定条件下折叠成独特的三维结构,进而发挥其生物学功能。目前,利用计算机手段预测蛋白质结构已成为该领域的主流方法。从头预测就是从一维氨基酸序列出发,进而准确地预测蛋白质三维结构的方法之一,但其固有的构象搜索空间的复杂性和高维性是该方法最主要的瓶颈。蛋白质的折叠过程非常复杂,在影响其折叠过程的因素中,氨基酸的疏水作用是主要作用之一,因此,考虑氨基酸的亲疏水性将有助于提高从头预测方法的采样效率。决定蛋白质结构的根本因素是其一维氨基酸序列,该序列通过盘曲折叠,形成具有一定空间结构的蛋白质分子,因此,蛋白质一级结构即一维氨基酸序列和二级结构信息的联合考量,将有助于进一步提高结构预测的效率和精度。然而,现有的构象空间优化方法在预测精度和采样效率方面都存在着缺陷,因此,结合上述几点影响因素本文档来自技高网...

【技术保护点】
1.一种基于局部有偏的蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:/n1)给定输入序列信息;/n2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建片段库;/n3)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数G

【技术特征摘要】
1.一种基于局部有偏的蛋白质结构预测方法,其特征在于,所述方法包括以下步骤:
1)给定输入序列信息;
2)利用PSIPRED平台预测目标蛋白的二级结构信息,利用ROSETTA平台构建片段库;
3)参数初始化:设置种群规模Ps,迭代计数器g,最大遗传代数Gmax,初始种群搜索轨迹长度N,交叉片段长度c,片段长度l,变异计数器T,最大计数值Tmax;
4)初始化种群:启动Ps条MonteCarlo轨迹,每条轨迹搜索N次,即生成Ps个初始个体;
5)对每个目标个体xi,进行如下操作:
5.1)对个体xi,进行变异操作:
5.1.1)随机产生一个整数d′∈[1,l-m],进而确定出个体xi的片段插入窗口[d′,m+d′],其中m是窗口大小;
5.1.2)根据公式计算窗口片段与片段库片段的疏水尺度差,其中是个体xi对应窗口片段中第i残基的疏水值,是片段库中片段第i残基的疏水值;
5.1.3)根据预测的二级结构,确定目标蛋白在对应窗口区域的二级结构Spre={seck|d′≤k≤d′+m},其中,seck∈{H,E,L}是预测的目标蛋白窗口区域第k个残基对应的二级结构类型,H,E,L分别代表α螺旋,β折叠和loop区域;
5.1.4)根据公式其中逐一计算片段库中片段的二级结构得分,其中表示片段库中片段h的第k个残基对应的二级结构类型;
5.1.5)根据公式分别计算片段库中各片段的得分并进行从高到低排序,其中,w1和w2分别是疏水尺度差与二级结构得分的权重,ΔRh表示片段库中第h个片段与目标窗口的疏水尺度差,表示片段库中第h个片段的二级结构得分;
5.1.6)从得分最高的前n个片段中随机选择一个片段,对个体xi进行片段组装生成,利用蒙特卡洛机制判断是否接收该片段的插入,若接收,即获得变异个体x′i,进入步骤5.2),否则进入步骤5.1.7)
5.1.7)更新迭代参数T,若T<Tmax,返回步骤5.1.6),否则直接片段组装生...

【专利技术属性】
技术研发人员:彭绍亮陈健王小奇陈东李肯立
申请(专利权)人:湖南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1