一种基于动量辅助构象空间采样的蛋白质结构预测方法技术

技术编号:34253238 阅读:19 留言:0更新日期:2022-07-24 12:03
一种基于动量辅助构象空间采样的蛋白质结构预测方法,通过构建动量不仅去除了能量陡峭点,还使构象采样过程更容易跳出局部最低点;将动量叠加到原有的能量函数,使得原本比较尖锐的能量函数变得平滑;并且由于动量保留了之前采样的信息,使得越是陡峭的能量低点越容易跳出,同时设计了一个自适应方法,在采样的开始动量更新的权重占比更大,随着采样次数的增加,减少动量更新的权重。本发明专利技术提供一种极大地提高了采样效率和采样能力、提高预测精度的基于动量辅助构象空间采样的蛋白质结构预测方法。预测方法。预测方法。

A protein structure prediction method based on momentum assisted conformational spatial sampling

【技术实现步骤摘要】
一种基于动量辅助构象空间采样的蛋白质结构预测方法


[0001]本专利技术涉及生物信息学、计算机应用领域,尤其涉及的是一种基于动量辅助构象空间采样的蛋白质结构预测方法。

技术介绍

[0002]蛋白质是生命的物质基础,了解它们的三维结构有助于从机制上理解它们的功能,如推理生物过程、实现基于结构的药物开发和靶标蛋白诱变等。因此几十年来得到蛋白质三维结构一直是生物学的一大挑战。
[0003]目前,测定蛋白质的三维结构主要有两大类方法:一类是生物湿实验的方法;另一类就是根据计算机技术根据蛋白质的氨基酸序列预测其三维结构的方法。生物湿实验一般是指核磁共振、X射线晶体衍射技术和冷冻电镜这些方法,尽管通过这些方法得到的蛋白质三维结构的精度非常高,但是也存在很大的缺点,如一个结构的预测周期较长、成本较高、难度大。而根据计算机技术预测蛋白质结构的方法可以高效,快速简便地获得蛋白质三维结构。并且蛋白质结构的计算方法的发展主要基于物理相互作用,现有的方法主要是使用传统的理化知识、结合机器学习预测残基间的距离和取向等,构建能量函数,利用策略在构象空间中搜索全局最优解。
[0004]但是,传统的蛋白质结构预测方法由于分子模拟的计算难度和蛋白质稳定性等方面的影响,现有的方法普遍存在三大缺陷:第一,极易陷入局部能量低点,虽然有概率跳出局部能量低点,导致采样不足;第二,传统的方法每次采样过程相互独立,彼此不能获取信息,而构象空间是非常庞大的,导致每次运行后容易反复进入局部能量低点,导致采样效率低;第三,目前的优化算法在遇到比较陡峭的能量低点时很难跨越,而这种能量低点并不一定是全局最优解,导致预测精度不高。
[0005]因此,现有的蛋白质结构预测方法存在采样不足、采样效率低下和预测精度不高等问题,需要改进。

技术实现思路

[0006]为了克服现有的蛋白质结构预测方法的采样效率低下、采样不足和预测精度不高的不足,本专利技术提供了一种基于动量辅助构象空间采样的蛋白质结构预测方法,通过构建动量不仅去除了能量陡峭点,还使构象采样过程更容易跳出局部最低点,将动量叠加到原有的能量函数,使得原本比较尖锐的能量函数变得平滑。并且由于动量保留了之前采样的信息,使得越是陡峭的能量低点越容易跳出,极大得提高了采样效率、采样能力和预测精度。
[0007]本专利技术解决其技术问题所采用的技术方案是:
[0008]一种基于动量辅助构象空间采样的蛋白质结构预测方法,所述方法包括以下步骤:
[0009]1)输入目标蛋白质的序列信息;
[0010]2)根据输入目标蛋白质的序列信息从Robetta服务器(http://www.robetta.org/)获取片段库文件,其中包括3片段库文件和9片段库文件;
[0011]3)设置参数:最大迭代次数G,初始动量M,衰减函数系数k,模拟退火算法初始温度T,动量能量项系数μ;
[0012]4)设置迭代次数g=1,g∈{1,2,...,G};
[0013]5)构象生成:利用Rosetta协议,生成初始构象,记为
[0014]6)对初始构象使用能量函数叠加动量的方法,过程如下:
[0015]6.1)设置能量函数E
g
(P)=score3(P),score3(P)为Rosetta协议中的能量函数,记为能量最低的接收构象,为当前构象的前一次被接收构象,初始化记为被接收构象的能量函数,为上一次被接收构象的能量函数;
[0016]6.2)记分别为能量最低的接收构象的第i个残基的二面角,分别为前一次被接收构象的第i个残基的二面角,L为目标蛋白的序列长度,d为两个构象直接的相似度,M
new
为当前动量,β为动量更新的参数,按如下公式计算动量M:
[0017][0018][0019]M=βM+(1

β)M
new
ꢀꢀꢀ
(3)
[0020]6.3)记P
g
为当前构象,E
g
(P
g
)为当前构象的能量,当前构象被接收的概率p,按以下公式计算:
[0021][0022]7)设置g=g+1,若g>G,则执行步骤8);否则转至步骤6);
[0023]8)输出G次迭代中G个能量最低构象作为最后预测结果,g∈{1,2,...,G}。
[0024]本专利技术的技术构思为:在原有的能量函数下增加动量能量项,每次采样结束后,如果通过模拟退火算法接收构象,则使用当前接收的构象和上次一次接收的构象,通过计算二面角差值计算构象梯度。将梯度信息自适应地更新到动量中,即在采样的一开始动量所占权重更大,随着采样次数增加,动量更新的权重自适应减少,防止出现到达最优解后仍然极易跳出全局最优解的情况发生。由于能量低点前的下降速率非常快,所以动量也会相应增加,使得更易跳出局部能量低点;而若跳过能量低点会产生负动量,所以不易跳出全局能量最低点。因此动量即包含了之前所有采样的梯度信息,又能自适应地调整动量大小,既能很快找到能量低点又能防止跳出能量低点。基于动量辅助构象空间采样的蛋白质结构预测方法不仅能提高采样效率和采样能力,而且能提高预测精度。
[0025]本专利技术的有益效果为:根据动量策略提高了采样效率和采样能力,通过多次迭代增加了构象的多样性。动量包含了采样过程全部的梯度信息,动量叠加通过一个自适应方
法保留影响最大的梯度下降信息,进一步提高了采样效率,同时提高了整体的预测精度。
附图说明
[0026]图1是一种基于动量辅助构象空间采样的蛋白质结构预测方法对蛋白质2QZJ_A进行结构预测的构象更新示意图
[0027]图2是一种基于动量辅助构象空间采样的蛋白质结构预测方法对蛋白质2QZJ_A进行结构预测的能量下降示意图
[0028]图3是一种基于动量辅助构象空间采样的蛋白质结构预测方法对蛋白质2QZJ_A进行结构预测的三维结构图
具体实施方式
[0029]下面结合附图对本专利技术作进一步描述。
[0030]参照图1~图3,一种基于动量辅助构象空间采样的蛋白质结构预测方法,所述方法包括以下步骤:
[0031]1)输入目标蛋白质的序列信息;
[0032]2)根据输入目标蛋白质的序列信息从Robetta服务器(http://www.robetta.org/)获取片段库文件,其中包括3片段库文件和9片段库文件;
[0033]3)设置参数:最大迭代次数G=100,初始动量M=10,衰减函数系数k=0.01,模拟退火算法初始温度T=2,动量能量项系数μ=1;
[0034]4)设置迭代次数g=1,g∈{1,2,...,G};
[0035]5)构象生成:利用Rosetta协议,生成初始构象,记为
[0036]6)对初始构象使用能量函数叠加动量的方法,过程如下:
[0037]6.1)设置能量函数E
g
(P)=score3(P),score3(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动量辅助构象空间采样的蛋白质结构预测方法,其特征在于:所述方法包括以下步骤:1)输入目标蛋白质的序列信息;2)根据输入目标蛋白质的序列信息从Robetta服务器获取片段库文件,其中包括3片段库文件和9片段库文件;3)设置参数:最大迭代次数G,初始动量M,衰减函数系数k,模拟退火算法初始温度T,动量能量项系数μ;4)设置迭代次数g=1,g∈{1,2,...,G};5)构象生成:利用Rosetta协议,生成初始构象,记为6)对初始构象使用能量函数叠加动量的方法,过程如下:6.1)设置能量函数E
g
(P)=score3(P),score3(P)为Rosetta协议中的能量函数,记为能量最低的接收构象,为当前构象的前一次被接收构象,初始化记为被接收构象的能量函数,为上一次被接收构象的能...

【专利技术属性】
技术研发人员:张贵军黄兆鸿夏瑜豪刘栋徐旭瑶周晓根
申请(专利权)人:浙江工业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1