当前位置: 首页 > 专利查询>大连大学专利>正文

基于BSA-TS算法的蛋白质三维结构预测方法技术

技术编号:12619947 阅读:162 留言:0更新日期:2015-12-30 17:24
本发明专利技术涉及生物计算蛋白质结构预测领域,设计了一种基于BSA算法与TS算法的混合搜素优化方法。该方法将BSA算法应用到蛋白质三维结构预测中,并对BSA算法与TS算法分别进行了一定的改进。在目前广泛使用的斐波纳契序列和真实蛋白质序列上进行实验,从实验得出的数据和与其他方法的比较结果来看,该方法较好的克服了传统算法对于控制参数的初值比较敏感,并且易陷入局部最优的缺点,具有良好的性能和精度。

【技术实现步骤摘要】

本专利技术涉及BSA算法,TS算法和三维AB非晶格模型,具体讲的是在蛋白质三维AB 非晶格模型中,通过对BSA算法及TS算法的改进与混合,以提高单一算法的算法精度,预测 到更稳定的蛋白质三维结构,其属于生物信息学蛋白质结构预测领域。
技术介绍
研究蛋白质结构,有助于了解蛋白质作用,了解其如何行使其生物功能,认识蛋白 质与蛋白质(或其它分子)之间的相互作用,这对于生物学,医学和药学都非常重要。而近 年来蛋白质结构测定的试验方法虽然得到很好发展,但仍比较耗时和昂贵,且对于某些不 易结晶的蛋白质来说不适用,因此需要发展理论分析方法。随着计算机技术的发展,其逐步 成为处理蛋白质分子超大数据的重要工具。 蛋白质三维结构的理论预测方法主要分为以下三步:一是提出能反映氨基酸残基 间相互作用和环境等的数学模型;二是根据热力学假设建立一个计算上简单又能正确区分 蛋白质天然结构与其它结构的能量函数,三是找到相应模型对应的能量函数最小值的全局 优化方法。由于研究人员的努力,关于上面三个步骤分别得到了很多的成果。对于蛋白质 结构模型,目前两个应用非常广的模型是HP晶格模型与AB非晶格模型。HP晶格模型使用 两种残基一一疏水性残基(H)与亲水性残基(P)表示氨基酸链,且各残基分布在堆叠的立 方晶格顶点。这个模型的缺点是忽略了在蛋白质折叠过程中很重要的局部反应。AB非晶格 模型比HP晶格模型更精确,因为其中氨基酸间键角是任意的。由于蛋白质折叠过程的复杂 性,准确的蛋白质能量函数的建立是困难的,目前有很多简化的能量函数被提出。对于全局 优化方法,基于HP晶格模型与AB非晶格模型的许多优化蛋白质结构预测算法已经被提出。 近年来,基于HP晶格模型的优化算法比如MOSE,ACO,MCMPS0-TS等算法。M0SE算法用一个 启发式偏差函数帮助理论的蛋白质结构形成疏水内核,但是这仅仅在简单折叠的蛋白质中 高效。AC0算法提出的灵感来源于对蚂蚁寻找食物的行为的观察,其算法框架可以被分成 三部分:蚂蚁解的构造,更新信息素,进程守护。MCMPS0-TS算法是一种联接了粒子群算法 (PS0)和禁忌算法(TS)以提尚全局优化能力的混合算法。基于AB非晶格|旲型的蛋白质结 构预测算法比如PSO,TPSO,LPSO,PGATS,ABC等算法。PS0算法的灵感来源于鸟群迀徙过程 中的信息交流,每只鸟不但能记住自己当前找到的距离食物最佳的位置,还可以知道种群 中所有鸟儿当前所能找到的最佳位置,由这两个最优值判断食物的最佳位置。TPS0算法联 接了PS0算法和TS算法,利用两个算法的优势提高搜索精度,跳出局部最优解。LPS0算法 在PS0算法中加入一种称为利维飞行的随机过程以提尚算法全局搜索能力。PGATS算法是 在GA-PS0基础上提出的,同时加入了改进的禁忌搜索算法的混合算法。ABC算法的提出源 于对蜜蜂采蜜行为的观察,此算法的主要特征是不用知道问题的特殊信息,只需要比较解 的优劣性。既然设计算法的目的是预测蛋白质结构,那么最重要的判断标准就是每个算法 所能预测到的对应能量函数的最低值。因此本文主要关注得到更低的能量值及对应的空间 结构,以蛋白质三维结构预测为研究目的,并基于改进BSA算法与禁忌算法,针对AB非晶格 模型提出了一种混合优化算法。通过在AB非晶格模型上的实验,结果表明此混合算法能得 到比几乎所有以上算法得到的最优结果更低的能量值。
技术实现思路
鉴于已有生产方法存在的缺陷,本专利技术提供一种基于三维AB非晶格模型的蛋白 质三维结构预测算法BSA-TS混合算法,该方法是将BSA算法用于蛋白质结构三维预测且加 以改进,同时在算法后期使用加入变异算子的TS算法,利用其全局搜索能力较强的优点对 BSA算法运行得到的优化结果进行进一步全局搜索,有效提高了算法的搜索精度,得到更稳 定的蛋白质三维结构。 该方法首先通过改进的BSA算法运行3000次得到较稳定的优化结果,然后利用改 进的TS算法进行2000次全局局部邻域搜索得到最终预测结果。在蛋白质三维结构预测过 程中,对使用的BSA算法所作的改进为:将BSA算法选择-II策略替换为惩罚机制,判断 种群中个体两两间欧氏距离,如果距离小于预设临界值D(经验值,与序列长度相关)时则 对其中适应值较高的个体实施惩罚操作,以此增加种群中个体的多样性;对TS算法所作的 改进为:引进了变异算子,使邻域产生前期对当前个体产生较大扰乱度,保证变异个体多样 性;邻域产生后期对当前解产生较小扰乱度,避免错过全局最优,以提高TS算法的全局搜 索能力和算法精度。 为实现上述目的,本专利技术所采用的技术方案是: 步骤1 :设置参数,初始化种群P与历史种群P°ld; 步骤2 :进入改进的BSA算法迭代循环部分,判断终止条件是否满足,满足则执行 步骤4,不满足则执行步骤3 ; 步骤3 :对种群依次执行选择-I策略、执行变异操作、执行交叉策略、执行边界控 制、执行惩罚机制; 步骤4 :对BSA部分得到的优化结果用改进的TS算法,通过引入变异算子进行全 局邻域搜索;当满足终止条件时,退出循环,输出优化结果。 所述的方法包括以下具体步骤: 1)随机初始化种群P和历史种群P°ld; 2)所述步骤2中终止条件为判断循环代数印k值是否小于3000,若大于3000,则 满足终止条件,执行9),否则执行3); 3)执行选择-I策略:在每次迭代初始时重新确定将被用来计算搜索方向的历史 种群P°ld: Ifa<bthenPold=P 其中,a,b为随机数,a,b~U(0, 1),从之前迭代得到的种群中选择一个作为历史 种群P°ld,并记住它直到再次发生变化; 4)在P°ld确定之后,对其中个体进行随机排序,并重新赋值给P°ld: Pold=Pold(randperm(popsize),:) 5)执行变异操作:产生实验种群Mutant的初始值: Mutant=P+F* (P〇ld_P) 其中,F是变异尺度,控制搜索方向矩阵(P°ld-P)的变异幅度,F取值为2. 5*randn, 其中randn是一个符合均值为0,方差为1的标准正态分布的随机数。 6)执行交叉策略:通过判断两个0到1之间的随机数大小而随机调用其两种交叉 策略;分别进行两种交叉时,首先确定交叉长度u以及对应交叉位置,交叉位置是先判断交 叉长度u,交叉位置在程序中是通过随机函数确定的u个交叉位置;然后将种群P与Mutant 中相同位置个体的同维元素互换(此处相同位置指的是两个200个个体的种群中都选择第 i个个体,同维指的是每个个体中的dim个维度中都选择第j个元素,以此形成相同大小矩 阵的对应元素互换),生成新种群P'与Mutant',并将P'赋给Mutant。在每次交叉时,u的 两种选择方式如下: a)交叉策略I:u(i) = 1 ; b)交叉策略II:"⑴=~训心:dim1。其中mixrate为交叉概率,dim为每 个染色体长度。 7)执行边界控制: 在执行交叉策略后,对种群Mutant个体中超出搜索范围的基因执行边界控制,通 过判断两个〇到1之间的随机数大小而等概率调用以下两种边界控制方法产生新基因,新 生成的实验种群记为Q: a)当种群Mutant中某基因Pu本文档来自技高网
...

【技术保护点】
基于BSA‑TS算法的蛋白质三维结构预测方法,其特征在于,包括以下步骤:步骤1:设置参数,初始化种群P与历史种群Pold;步骤2:进入改进的BSA算法迭代循环部分,判断终止条件是否满足,满足则执行步骤4,不满足则执行步骤3;步骤3:对种群依次执行选择‑Ⅰ策略、执行变异操作、执行交叉策略、执行边界控制、执行惩罚机制;步骤4:对BSA部分得到的优化结果用改进的TS算法,通过引入变异算子进行全局邻域搜索;当满足终止条件时,退出循环,输出优化结果。

【技术特征摘要】

【专利技术属性】
技术研发人员:张强许岩周昌军王宾
申请(专利权)人:大连大学
类型:发明
国别省市:辽宁;21

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1