A kind of Rosetta protein structure prediction method based on local enhancement group, first of all, the structure prediction algorithm for the whole search process is divided into four stages, each stage of the length of the fragment set fragment assembly, quality and selection of different energy function to measure the conformation of the individual; and then, the two stage structure information based on the mutation strategy the use of different regional information loop to generate test conformation, and cross process by random exchange loop regional information, maintain population diversity, while testing the conformation and target conformation of each stage of the implementation of Rosetta local enhancement; finally, the extracted feature vector to measure the conformational diversity of each individual to conformation, energy function the main measure and diversity as the auxiliary measure to guide the conformation of population regeneration. The invention has the advantages of strong searching ability, energy conservation, population diversity and high prediction accuracy.
【技术实现步骤摘要】
一种基于Rosetta局部增强的群体蛋白质结构预测方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域,尤其涉及的是,一种基于Rosetta局部增强的群体蛋白质结构预测方法。
技术介绍
蛋白质是细胞功能的核心,与大部分核心生命过程息息相关。事实上,蛋白质只有折叠成特定的三维结构(即蛋白质三级结构)之后才能产生其特定的生物学功能。因此,为了解蛋白质的功能,就必须获得其三维空间结构,从而通过了解蛋白质的三维结构推动功能材料设计和新型药物研制的发展,帮助人们理解生命的基本过程,包括对阿尔兹海默症、帕金森病以及II型糖尿病等蛋白质折叠病的认识。目前常用的蛋白质结构测定方法有X射线衍射和核磁共振(NMR),这两种方法虽然预测精度高,但是对于X射线衍射来说,难以培养晶体且晶体结构测定的周期较长,核磁共振对样品的需要量大、纯度要求高,目前只能用于小分子蛋白质结构的测定。因此,以计算机为工具,利用适当的优化算法,直接通过氨基酸序列预测蛋白质三维结构,进而设计具有潜在药物价值的新功能蛋白质与多肽分子是生命科学领域需要解决的一个根本问题。该问题的最终解决关键在于:如何利用现 ...
【技术保护点】
一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)输入待测蛋白质的氨基酸序列信息;2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L
【技术特征摘要】
1.一种基于Rosetta局部增强的群体蛋白质结构预测方法,其特征在于:所述蛋白质结构预测方法包括以下步骤:1)输入待测蛋白质的氨基酸序列信息;2)初始化:设置种群规模NP,交叉概率CR,策略选择因子CS,多样性接受概率RS,Rosetta轨迹长度T,片段长度L1,L2;3)根据序列信息以片段长度L1进行随机片段组装生成初始构象种群P={C1,C2,...,CNP},其中,Ci的表示当前种群中的第i个构象个体,并根据能量函数RosettaScore0计算各构象个体的能量,同时初始化迭代次数G=0;4)采用能量函数RosettaScore0评价构象的质量,以片段长度L1对初始种群中的每个构象个体执行轨迹长度为T的Rosetta局部增强,并计算每个构象的特征向量;5)对步骤4)中增强后的每个构象个体Ci,i∈{1,2,…,NP}作如下处理:5.1)设置能量函数和片段长度:5.1.1)如果当前迭代次数0<G≤Gmax/3,则片段长度l=L1,且选用能量函数RosettaScore1;5.1.2)如果当前迭代次数Gmax/3<G≤2Gmax/3,则片段长度l=L1,且选用能量函数RosettaScore2;5.1.3)如果当前迭代次数G>2Gmax/3,则片段长度l=L2,且选用能量函数RosettaScore35.2)如果当前迭代次数G为Gmax/3的整数倍,则对以片段长度l对构象个体Ci执行轨迹长度为T的Rosetta局部增强,并根据步骤5.1)中设置的能量函数进行评价;5.3)计算目标构象Ci的特征向量,以及Ci与当前种群中其他构象之间的特征向量欧氏距离,并以最小距离为Ci的多样性值Di;5.4)根据序列信息,利用DSSP得到待测蛋白的loop区域,并随机生成一个0到1之间的随机数p;5.5)如果p<CS,则从当前种群中选取三个互不相同的构象个体Ca、Cb和Cc,其中,a≠b≠c≠i,a,b,c∈[1,NP],从构象个体Cb...
【专利技术属性】
技术研发人员:张贵军,周晓根,郝小虎,王柳静,俞旭锋,
申请(专利权)人:浙江工业大学,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。