当前位置: 首页 > 专利查询>苏州大学专利>正文

蛋白质三维结构的预测方法及预测装置制造方法及图纸

技术编号:7272381 阅读:227 留言:0更新日期:2012-04-15 20:07
本发明专利技术提供了一种蛋白质三维结构的预测方法,包括:a、选择目标蚁群,初始化蚁群算法参数;b、初始化蛋白质构象,建立蛋白质构象与片段库的映射关系;c、以蛋白质构象上的任一位置为起点,目标蚁群在信息素的指引下进行优化,对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象;d、对能量最小的蛋白质构象进行局部优化,并进行能量计算,根据计算结果更新信息素矩阵,并将局部优化后的蛋白质构象的能量与能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象;e、重复步骤c~d,得到较优蛋白质构象;f、对较优蛋白质构象进行Loop重建,得到最优蛋白质构象。本发明专利技术还提供了一种蛋白质三维结构的预测装置。

【技术实现步骤摘要】

本专利技术涉及蛋白质结构预测
,尤其涉及一种蛋白质三维结构的预测方法及预测装置
技术介绍
生物学研究表明,蛋白质是由特定的氨基酸序列构成的。正常情况下,蛋白质并不是以完全伸展的多肽链结构存在,而是以紧密折叠的三维结构存在,并且一个特定蛋白质行使其功能的能力通常由其三维结构决定。因此,确定蛋白质的三维结构,或称其构象,是生物领域的一项重要课题。目前,采用X射线衍射和核磁共振等分析化学的方法已经实现了对部分蛋白质三维结构的分析,但是,这些分析技术需要花费大量的时间和费用,不能满足蛋白质结构分析的需要,而结合信息技术发展起来的蛋白质结构预测方法由于具有快速的优点成为研究热;ο现有预测蛋白质结构的方法主要有两种比较建模法和从头预测法。比较建模法是通过比较目标蛋白质与另外一种已知结构、其氨基酸序列与目标蛋白质联系密切的蛋白质进行预测,比较建模法需要以结构已知、且其氨基酸序列与目标蛋白质相似的蛋白质为基础,如果不存在与目标蛋白质氨基酸序列相似的蛋白质,则无法进行预测。而从头预测是假设折叠后的蛋白质取能量最低的构象,通过计算得到蛋白质每一部分不同的卷曲状态对应的结构,直到发现最低能量状态。从头预测蛋白结构有两个关键问题一是找到一个能严格区分蛋白质的天然构象和非天然构象的能量函数;二是选择适当的搜索算法,即选择有效的优化算法。现有技术公开了使用遗传算法、模拟退火算法等算法对蛋白质三维结构进行预测,但是,使用这些算法进行预测的精度较低。
技术实现思路
有鉴于此,本专利技术所要解决的技术问题在于提供一种蛋白质三维结构的预测方法及预测装置,本专利技术提供的预测方法能够实现对蛋白质三维结构的从头预测,预测精度较尚ο本专利技术提供了一种蛋白质三维结构的预测方法,包括a、选择目标蚁群,初始化蚁群算法参数;b、初始化蛋白质构象,建立蛋白质构象与片段库的映射关系;C、以所述蛋白质构象上的任一位置为起点,所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化,利用能量函数对优化后的蛋白质构象进行能量计算,选择能量最小的蛋白质构象;d、对所述能量最小的蛋白质构象进行局部优化,利用能量函数对局部优化后的蛋白质构象进行能量计算,根据所述计算结果更新信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象;e、重复步骤c d,直至满足终止条件,得到较优蛋白质构象;f、对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。优选的,选择ρ个目标蚁群,初始化蚁群算法参数时,使P个目标蚁群共享同一个信息素矩阵。优选的,所述ρ个目标蚁群在信息素的指引下并行对所述蛋白质构象进行优化, 利用η个能量函数对优化后的蛋白质构象进行能量计算,所述1 < η < ρ。优选的,还包括g、将所述最优蛋白质构象进行交叉,得到交叉蛋白质构象,所述交叉蛋白质构象和所述最优蛋白质构象共同构成蛋白质构象decoys集。优选的,所述步骤c包括Cl、随机选择片段库F;c2、随机选择片段位置i,从所述片段库F中确定第i组片段集合Fi ;c3、目标蚁群在信息素的指引下从片段集合Fi中选择片段。,并根据蛋白质构象与片段库的映射关系,用&替换所述初始蛋白质构象中对应位置的片段;c4、重复步骤Cl c3,使所述初始蛋白质构象上的所有片段至少被替换一次,得到优化的蛋白质构象;c5、重复步骤Cl c4,直至满足预定次数w,得到w个优化的蛋白质构象;c6、利用能量函数分别对所述w个优化的蛋白质构象进行能量计算,选择能量最小的蛋白质构象。优选的,所述步骤d包括dl、随机选择片段库F;d2、随机选择位置i,从所述片段库F中确定第i组片段集合Fi ;(13、从&中选择p-pt个启发值η υ最高的片段{fj};d4、根据蛋白质构象与片段库的映射关系,用{fj中的片段替换步骤c中得到的能量最小蛋白质构象中对应位置的片段,计算替换后的蛋白质构象与替换前的蛋白质构象的能量差Δ E,并判断是否接受替换如果ΔΕ<0,则接受替换,如果ΔΕ>0,则根据 Metropolis规则判断是否接受替换;d5、重复步骤d4,直至{fj}中的p-pt个片段均至少经过一次替换;d6、重复步骤dl d5,直至满足预定次数Q,得到局部优化的蛋白质构象;d7、利用能量函数对所述局部优化的蛋白质构象进行能量计算,根据所述计算结果更新所述信息素矩阵,并将所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,选择能量小的蛋白质构象。本专利技术还提供可一种蛋白质三维结构的预测装置,包括蚁群选择单元,用于选择目标蚁群;初始化单元,用于初始化蚁群算法参数和蛋白质构象,并建立蛋白质构象和片段库的映射关系;片段选择单元,用于选择蛋白质构象片段;蚁群控制单元,用于控制所述目标蚁群在信息素的指引下对所述初始蛋白质构象进行优化;第一能量计算单元,用于对优化后的蛋白质构象进行能量计算,并选择能量最小的蛋白质构象;蛋白质构象局部优化单元,用于对所述能量最小的蛋白质构象进行局部优化;第二能量计算单元,用于对所述局部优化后的蛋白质构象进行能量计算;信息素矩阵更新单元,用于根据第二能量计算单元的计算结果更新信息素矩阵;比较单元,用于对所述局部优化后的蛋白质构象的能量与所述能量最小的蛋白质构象的能量进行比较,并选择能量小的蛋白质构象;循环控制单元,用于控制对蛋白质构象进行优化和局部优化操作的循环;判断单元,用于判断循环是否满足终止条件,如果否,则通知所述蚁群控制单元继续进行控制所述目标蚁群在信息素的指引下对所述蛋白质构象进行优化;如果是,则确定较优蛋白质构象;Loop重建单元,用于对所述较优蛋白质构象进行Loop重建,得到最优蛋白质构象。优选的,还包括交叉控制单元,用于将所述最优蛋白质构象进行交叉。与现有技术相比,本专利技术采用并行蚁群算法对蛋白质三维结构进行从头预测,主要采用并行蚁群算法对蛋白质构象进行优化,并采用贪婪模拟退火相结合的方法对所述优化后的蛋白质构象进行局部优化,在局部优化的过程中选择迭代最好解更新并行蚁群共享的信息素矩阵,从而使随机搜索成为在信息素指引下进行的搜索,提高了搜索的质量,从而提高了预测的精度。另外,本专利技术融合了不同的能量函数对优化和局部优化后的蛋白质构象进行评价,使预测得到的蛋白质结构能够融合不同能量函数的评价标准,减少单一能量函数的偏好,从而更接近于蛋白质的实际结构。实验表明,采用本专利技术提供的预测方法对第8届关于蛋白质结构预测技术评估(the 8th Critical Assessment of Techniques for Protein Structure Prediction, CASP8)的全社会实验所公布的13个从头预测类案例进行预测,将得到的结果与CASP8比赛结果的实际排名进行对照,其中有2个案例的预测结果超过CASP8中最好的结果,7个位列前10名,取得了较好的预测效果。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获本文档来自技高网...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:吕强
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术