System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于全局和局部策略协作的蛋白质结构预测方法技术_技高网

一种基于全局和局部策略协作的蛋白质结构预测方法技术

技术编号:40580469 阅读:5 留言:0更新日期:2024-03-06 17:23
本发明专利技术提供一种基于全局和局部策略协作的蛋白质结构预测方法,属于蛋白质结构预测技术领域,方法包括如下,将测蛋白质的序列信息输入到识别库中,对种群初始化设置;查找序列中所有残基位相关的片段库,从相关片段库中随机选取片段出来组装生成初始构象,然后所有的初始构象组成构象种群;然后得到二次相关片段库和二次构象库,进行全局和局部策略协作,输出能量最低的构象作为最终预测结构。本发明专利技术通过二次生成片段库,从而更加丰富二楼蛋白质的变异原始数据,然后再使用二次变换的片段组成构象作为种群的初始物种,物种更加的丰富,同时进过全局和局部协作,使得输出的构象符合预测的需求,结果更加的精准。

【技术实现步骤摘要】

本专利技术涉及蛋白质结构预测,尤其涉及一种基于全局和局部策略协作的蛋白质结构预测方法


技术介绍

1、目前,测定蛋白质三维结构的实验方法包括x射线晶体衍射、多维核磁共振(nmr)和冷冻电镜等。x射线晶体衍射是目前测定蛋白质结构最有效的方法,所达到的精度是其它方法所不能比拟的,主要缺点是蛋白质晶体难以培养且晶体结构测定的周期较长;nmr方法可以直接测定蛋白质在溶液中的构象,但是对样品的需要量大、纯度要求高,目前只能测定小分子蛋白质。其次,这些实验测定方法价格昂贵,测定一个蛋白质的三维结构需要几十万美元,然而,测定一个蛋白质的一级氨基酸序列仅需1000美元左右,从而导致蛋白质序列和三维结构测定之间的鸿沟越来越大。因此,如何以计算机为工具,运用适当的算法,从氨基酸序列出发直接预测蛋白质的三维结构,成为当前生物信息学中一种重要的研究课题。

2、构象空间优化(或称采样)方法是目前制约蛋白质结构从头预测精度最关键的因素之一。差分进化算法(differential evolution,de)作为进化算法中最强大的算法,是price和storn在1995年提出的一种随机性算法。de算法由于结构简单、收敛速度快、鲁棒性强等优点,在蛋白质构象空间优化领域有了广泛的应用。sudha等提出一种基于局部策略的差分进化蛋白质结构预测方法;custodio等提出一种局域基于相似度代理模型的群体蛋白质结构预测预测方法;shehu研究小组基于de算法,提出一系列有效的蛋白质构象空间优化方法,如多尺度混合进化算法hea和多目标构象空间优化方法moea等。实验结果表明,上述算法可以有效的预测得到一些小规模的蛋白质结构。然而,随着蛋白规模的增大,构象搜索空间也随之上升,由于de算法全局探测能力较强,而局部搜索能力较弱,从而导致后期搜索效率较低;其次,能量曲面极其复杂,包含上千个局部搜索区域,导致算法容易陷入局部最优,从而影响预测精度。


技术实现思路

1、本专利技术的目的在于提供一种基于全局和局部策略协作的蛋白质结构预测方法,解决
技术介绍
中提到的技术问题。

2、为了实现上述目的,本专利技术采用的技术方案如下:

3、一种基于全局和局部策略协作的蛋白质结构预测方法,所述方法包括如下步骤:

4、步骤1:获取待测蛋白质的序列信息,并将测蛋白质的序列信息输入到识别库中;

5、步骤2:对种群初始化设置;

6、步骤3:查找与待测蛋白质序列中所有残基位相关的片段库,得到相关片段库;

7、步骤4:从相关片段库中随机选取片段出来组装生成初始构象,然后所有的初始构象组成构象种群;

8、步骤5:识别构象种群所有个体的序列信息,然后在查找所有个体各个残基位相关的片段库,得到二次相关片段库;

9、步骤6:从相关的片段库和二次相关片段库众随机选取片段组装成二次构象,得到二次构象库;

10、步骤7:对二次构象种群中的每个个体进行全局策略协作得到新种群;

11、步骤8:对新种群中的每个个体进行局部策略协作,输出能量最低的构象作为最终预测结构。

12、进一步地,步骤1的具体过程为:从识别输入单元输入需要识别的蛋白质片段,然后识别输入单元自动识别出待测蛋白质的序列信息,然后把序列信息传给识别库,识别库与swiss-prot数据库相连接,从swiss-prot数据库中获取对比数据。

13、进一步地,步骤2的具体过程为:设置进化代数计数器t=0,设置最大进化代数t,片段长度l,交叉概率cr,温度因子kt,种群规模np。

14、进一步地,步骤3的具体过程为:首先确定待测蛋白质序列中的所有残基位,然后再对每个残基位从数据库中查找相关的片段库,然后把所有查找到的片段库进行汇总,然后把相同的片段库留取一个,其余的删除,得到相关的片段库。

15、进一步地,步骤4的具体过程为:使用序号对相关片段库中片段进行编对应的编号,然后将随机将编号组装成初始数字构象,然后初始数字构象对应的片段组成的构象即为初始构象,然后将初始数字构象进行汇总得到数字构象种群,然后映射的偏短组成的即为构象种群。

16、进一步地,步骤5的具体过程为:识别构象种群中所有初始构象的序列信息,然后查找所有初始构象序列的残基位,然后在识别库中查找与初始构象序列的残基位相关的片段库,然后将所有的片段库进行汇总得到二次相关片段库。

17、进一步地,步骤6的具体过程为:将二次相关片段库中所有片段进行数字编号,然后随机选取片段对应的编号组成的二次数字构象,然后把所有的二次构象汇总为二次构象库。

18、进一步地,步骤7的具体过程为:

19、将所有的二次构象库中的二次构象进行选取一个及以上的残基位与任意若干个二次构象不同的残基位进行对调,然后生成一代变异构象,得到一代变异构象种群,然后通过能量函数进行计算所有二次构象中能量值最低的二次构象为最低二次构象,同时使用能量函数进行计算所有一代变异构象的能量值得到最低一代变异构象,将最低二次构象的能量值与最低一代变异构象的能量值对比,当最低一代变异构象的能量值低时,进行选用所有的一代变异构象进行选取残基位与任意的一代变异构象进行不同的残基位对调,得到二代变异构象,然后计算所有二代变异构象中能量值最低的最低二代变异构象,然后把最低二代变异构象与上面的最低能量值的构象对比,如果后面的变异构象的最低能力值的最低变异构象比前面最低能力值的变异构象的能量值高时,则输出最低能量值的变异构象,同时产生最低能量值的变异构象一代的变异构象种群作为下一步骤的处理初始种群。

20、进一步地,步骤8的具体过程为:最低能量值的变异构象为i,则选择产生最低能量值的变异构象一代的变异构象种群中能量值排名在百分之二十到百分之六十的变异构象作为数据处理构象,然后筛选出来得到部分变异构象,然后将分变异构象中每个变异构象中所有的残基位进行调换,当一个片段有一个残基位,有的有两个及以上时,则拿相同的残基位与另外一个的片段的所有残基位记性对调,然后得到二次部分变异构象,然后再使用能量函数计算二次部分变异构象中能量值最低的二次部分变异构象,同时与变异构象为i进行能量值对比,输出最低能量值的变异构象。

21、本专利技术由于采用了上述技术方案,具有以下有益效果:

22、本专利技术通过二次生成片段库,从而更加丰富二楼蛋白质的变异原始数据,然后再使用二次变换的片段组成构象作为种群的初始物种,物种更加的丰富,同时进过全局和局部协作,使得输出的构象符合预测的需求,结果更加的精准。

本文档来自技高网...

【技术保护点】

1.一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:所述方法包括如下步骤:

2.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤1的具体过程为:从识别输入单元输入需要识别的蛋白质片段,然后识别输入单元自动识别出待测蛋白质的序列信息,然后把序列信息传给识别库,识别库与SWISS-PROT数据库相连接,从SWISS-PROT数据库中获取对比数据。

3.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤2的具体过程为:设置进化代数计数器t=0,设置最大进化代数T,片段长度l,交叉概率CR,温度因子KT,种群规模NP。

4.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤3的具体过程为:首先确定待测蛋白质序列中的所有残基位,然后再对每个残基位从数据库中查找相关的片段库,然后把所有查找到的片段库进行汇总,然后把相同的片段库留取一个,其余的删除,得到相关的片段库。

5.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤4的具体过程为:使用序号对相关片段库中片段进行编对应的编号,然后将随机将编号组装成初始数字构象,然后初始数字构象对应的片段组成的构象即为初始构象,然后将初始数字构象进行汇总得到数字构象种群,然后映射的偏短组成的即为构象种群。

6.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤5的具体过程为:识别构象种群中所有初始构象的序列信息,然后查找所有初始构象序列的残基位,然后在识别库中查找与初始构象序列的残基位相关的片段库,然后将所有的片段库进行汇总得到二次相关片段库。

7.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤6的具体过程为:将二次相关片段库中所有片段进行数字编号,然后随机选取片段对应的编号组成的二次数字构象,然后把所有的二次构象汇总为二次构象库。

8.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤7的具体过程为:

9.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤8的具体过程为:最低能量值的变异构象为i,则选择产生最低能量值的变异构象一代的变异构象种群中能量值排名在百分之二十到百分之六十的变异构象作为数据处理构象,然后筛选出来得到部分变异构象,然后将分变异构象中每个变异构象中所有的残基位进行调换,当一个片段有一个残基位,有的有两个及以上时,则拿相同的残基位与另外一个的片段的所有残基位记性对调,然后得到二次部分变异构象,然后再使用能量函数计算二次部分变异构象中能量值最低的二次部分变异构象,同时与变异构象为i进行能量值对比,输出最低能量值的变异构象。

...

【技术特征摘要】

1.一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:所述方法包括如下步骤:

2.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤1的具体过程为:从识别输入单元输入需要识别的蛋白质片段,然后识别输入单元自动识别出待测蛋白质的序列信息,然后把序列信息传给识别库,识别库与swiss-prot数据库相连接,从swiss-prot数据库中获取对比数据。

3.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤2的具体过程为:设置进化代数计数器t=0,设置最大进化代数t,片段长度l,交叉概率cr,温度因子kt,种群规模np。

4.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤3的具体过程为:首先确定待测蛋白质序列中的所有残基位,然后再对每个残基位从数据库中查找相关的片段库,然后把所有查找到的片段库进行汇总,然后把相同的片段库留取一个,其余的删除,得到相关的片段库。

5.根据权利要求1所述的一种基于全局和局部策略协作的蛋白质结构预测方法,其特征在于:步骤4的具体过程为:使用序号对相关片段库中片段进行编对应的编号,然后将随机将编号组装成初始数字构象,然后初始数字构象对应的片段组成的构象即为初始构象,然后将初始数字构象进行汇总得到数字构象种群,然后映射的偏短组成的即为构象种群。<...

【专利技术属性】
技术研发人员:罗德相刘书言覃肖云罗可农杰罗少仕
申请(专利权)人:广西医科大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1