一种蛋白质结构预测能量函数权重优化方法技术

技术编号：20567669 阅读：117 留言：0更新日期：2019-03-14 09:57

一种蛋白质结构预测能量函数权重优化方法，首先，将所有能量项的权重设置为1，通过蛋白质结构预测方法利用待确定能量项权重的能量函数产生多个样本构象；然后，基于差分进化算法，将各能量项的权重值看作优化变量，以样本构象的能量值和均方根偏差之间的相关系数最大为目标，对各能量项权重值进行优化；最后，利用优化得到的权重值对应的能量函数对构象空间进行优化，以能量值最小的构象作为最终的预测结构。本发明专利技术提供一种能够得到合理能量项权重值的蛋白质结构预测能量函数权重优化方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种蛋白质结构预测能量函数权重优化方法
本专利技术涉及一种生物学信息学、智能优化、计算机应用领域，尤其涉及的是一种蛋白质结构预测能量函数权重优化方法。
技术介绍
蛋白质结构实验测定方法是结构基因组学研究的主要内容。X射线晶体学是测定蛋白质结构最有效的方法，所能达到的精度是其它方法所不能比拟的，缺点主要是蛋白质晶体难以培养且晶体结构测定的周期较长；多维核磁共振(NMR)方法可以直接测定蛋白质在溶液中的构象，但是由于对样品的需要量大、纯度要求高，目前只能测定小分子蛋白质。总体上，结构实验测定方法主要存在两方面问题：一方面，对于现代药物设计的主要靶标膜蛋白而言，通过实验方法极难获得其结构；另一方面，测定过程费时费钱费力。在理论探索和应用需求的双重推动下，根据Anfinsen法则，利用计算机设计适当的算法，以序列为起点，三维结构为目标的蛋白质结构预测自20世纪末蓬勃发展。从头预测方法实质上就是利用计算机的快速处理能力，利用优化算法在蛋白质构象空间搜索全局最优构象解。为了评价预测中构象的质量，即判断是否为能量较低的构象，可以根据蛋白质结构中原子坐标的几何信息与已知势能函数联系起来，并将这些函数按照一定的权重组合起来形成力场。力场大致可以分为两种：第一种是基于物理的力场模型，即考虑角弯曲能、键伸展能、氢键相互作用、范德华相互作用和静电作用等，典型的物理力场有AMBER力场和CHARMM力场；第二种是基于知识的力场模型，通过提取PDB库中已知结构的信息来构建能量函数，对于蛋白质结构预测来说，PDB库不仅可以用来进行模板搜索，还可以用于挖掘已知蛋白结构的特征信息，从而构建...

【技术保护点】
1.一种蛋白质结构预测能量函数权重优化方法，其特征在于：所述方法包括以下步骤：1)给定需要确定权重的蛋白质能量函数E，以及各能量项E1,E2,...,EN，其中N为能量项的数量，En表示能量函数E的第n个能量项，n＝1,2,...,N；2)参数设置：设置种群规模NP，交叉概率CR，步长因子F，蛋白质样本构象数量S，最大迭代次数Gmax，并初始化迭代次数g＝0；3)将所有能量项的权重设置为1，运用该能量函数对应的蛋白质结构预测方法生成S个样本构象，并记录第s个样本的第n项能量项的值

【技术特征摘要】
1.一种蛋白质结构预测能量函数权重优化方法，其特征在于：所述方法包括以下步骤：1)给定需要确定权重的蛋白质能量函数E，以及各能量项E1,E2,...,EN，其中N为能量项的数量，En表示能量函数E的第n个能量项，n＝1,2,...,N；2)参数设置：设置种群规模NP，交叉概率CR，步长因子F，蛋白质样本构象数量S，最大迭代次数Gmax，并初始化迭代次数g＝0；3)将所有能量项的权重设置为1，运用该能量函数对应的蛋白质结构预测方法生成S个样本构象，并记录第s个样本的第n项能量项的值s＝1,2,...,S,n＝1,2,...,N，以及该样本与天然态结构之间的均方根偏差Rs；4)将所有能量项权重组成的权重向量W＝(W1,W2,...,WN)看作一个个体，其中Wn表示能量项En的权重，在(0,1]内随机生成NP个初始个体，组成初始种群其中Wi,g,i＝1,2,...,NP表示第g代种群中的第i个个体；5)计算每个个体Wi,g,i＝1,2,...,NP的均方根偏差和能量的相关系数C(Wi,g)：其中为根据第g代的第i个个体Wi,g对应的权重计算得到的第s个样本的能量值，为Wi,g的第n维变量，为所有样本均方根偏差的平均值，为所有样本能量的平均值；6)对种群中的每个个体Wi,g,i∈{1,2,...

【专利技术属性】
技术研发人员：周晓根，张贵军，彭春祥，刘俊，胡俊，郝小虎，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人