一种碳末端酰胺化多肽结构的动力学预测方法和装置制造方法及图纸

技术编号:33040687 阅读:9 留言:0更新日期:2022-04-15 09:21
本发明专利技术属于生物信息分析领域,公开了一种碳末端酰胺化多肽结构的动力学预测方法和装置。本发明专利技术针对现有的结构预测技术难以进行特异性结构建模,采用常规的分子动力学进行从头算的折叠模拟难以充分地进行构象采样,且计算量大的问题,提供了一种能节省大量时间和费用,可以体现出多肽结构的特异性,便于与实验结果相比较的预测方法和装置。结果相比较的预测方法和装置。结果相比较的预测方法和装置。

【技术实现步骤摘要】
一种碳末端酰胺化多肽结构的动力学预测方法和装置


[0001]本专利技术涉及一种碳末端酰胺化多肽结构的动力学预测方法和装置,尤其涉及一种基于全原子分子动力学与增强采样的碳末端酰胺化多肽结构的动力学预测方法和装置,属于生物信息学、蛋白质结构和分子动力学领域。

技术介绍

[0002]多肽是一种由α

氨基酸脱水缩合而形成的化合物,通常含有10~50个氨基酸。多肽是生物体内重要的活性物质,例如酶、激素、神经间质、细胞生长和生殖因子等,具有调节细胞的生理功能、激活生物体内的相关酶系、传递神经系统信息、运输物质等功能。多肽的结构决定其功能,因此确定多肽的结构对理解其生物学活性具有重要意义,对多肽类产品的开发也具有实用价值。
[0003]多肽药物,因其适应症广、安全性高且疗效显著,目前已广泛应用于糖尿病、骨质疏松、癌症等疾病的预防、诊断和治疗。基因工程重组技术和化学合成技术是多肽药物制备过程中的两种常用技术。基因工程重组技术通过生物表达和提取过程,能获得与天然多肽完全一致的空间结构和生物学活性。而化学合成多肽,通常按多肽的氨基酸序列顺序从碳末端向氮末端进行合成,因其合成过程中多肽的碳末端会携带游离的羧基,因此将其碳末端酰胺化。当基因工程重组多肽和化学合成多肽具有相同的氨基酸序列时,人们往往不会关注末端结构的微小差异。随着循证医学的逐渐发展和重视,对于药物在治疗过程中的安全性和有效性,更加关联至分子本身的空间构象的影响。末端酰胺化和天然羧基的不同,很可能导致多肽分子理化性质、空间结构、免疫原性等不同。由于多肽的序列短、柔性较大,现有的结构解析技术难以在相同的生理仿真环境中测定末端酰胺化和天然多肽的结构,这不利于揭示末端酰胺化与天然多肽的结构异同。鉴于此,设计一种能快速且准确度高的构建多肽结构的方法具有十分重要的意义。然而,化学合成的多肽与天然多肽的氨基酸序列完全相同,基于生物信息学的结构预测技术难以进行特异性结构建模。采用常规的分子动力学进行从头算的折叠模拟,难以充分地进行构象采样,且计算量大。
[0004]本专利技术致力于解决上述技术问题,提出了一种从多肽的天然结构出发,使用全原子分子动力学与增强采样相结合的动力学计算来预测碳末端酰胺化多肽结构的方法和装置。

技术实现思路

[0005]本专利技术的目的是针对目前还没有基于多肽的天然结构特异性地预测碳末端酰胺化多肽结构的技术现状,提出了一种碳末端酰胺化多肽结构的动力学预测方法和装置。
[0006]本专利技术所述方法基于多肽的天然结构,构建碳末端酰胺化多肽的初始构象,在溶剂环境中对碳末端酰胺化多肽进行原子水平的增强构象采样计算,在采样空间上重建其自由能,找寻其自由能极小,在构象空间中提取自由能极小的结构,从而获得碳末端酰胺化多肽结构。
[0007]为此,本专利技术一方面提供了一种碳末端酰胺化多肽结构的动力学预测方法,包括以下步骤:
[0008]1、获取多肽的天然结构,基于多肽的天然结构构建碳末端酰胺化多肽的初始构象;
[0009]2、采用步骤1构建的碳末端酰胺化多肽的初始构象,进行全原子分子动力学的平衡处理;
[0010]3、采用步骤2经过平衡处理的碳末端酰胺化多肽体系,对碳末端酰胺化多肽进行原子水平的增强采样计算;
[0011]4、利用步骤3的增强采样计算获得的数据,重建碳末端酰胺化多肽的自由能,搜索自由能极小构象。
[0012]为达到上述目的,本专利技术采取如下技术方案。
[0013]所述一种碳末端酰胺化多肽结构的动力学预测方法,包括以下步骤:
[0014]步骤1:获取多肽的天然结构,构建碳末端酰胺化多肽的初始构象;
[0015]其中,多肽的天然结构从蛋白质数据银行(PDB)下载;
[0016]其中,碳末端酰胺化多肽的初始构象是基于多肽的天然结构构建,具体包含如下子步骤:
[0017]步骤1.1对多肽的天然结构进行预处理,具体为:
[0018]删除多肽的天然结构中的水分子、离子等无用的成分,检查多肽的天然结构是否存在残基和原子的缺失,补全缺失的残基和原子,如果多肽的天然结构仅包含重原子则添加氢原子;
[0019]步骤1.2采用步骤1.1经过预处理的多肽的天然结构,构建碳末端酰胺化多肽的初始构象,具体为:
[0020]采用工具软件PdbViewer显示步骤1.1经过预处理的多肽的天然结构,找到碳末端氨基酸残基的羧基(

COOH),将羧基中的羟基(

OH)删除,编辑氨基(

NH2)构象并使氮原子与碳原子成键,即为碳末端酰胺化多肽的初始构象。
[0021]步骤2:采用步骤1构建的碳末端酰胺化多肽的初始构象,进行全原子分子动力学的平衡处理,具体为:
[0022]采用步骤1.2构建的碳末端酰胺化多肽的初始构象,选择全原子力场和水模型,生成拓扑文件,定义溶剂盒子的形状和大小,添加水分子和抗衡离子,先对溶剂化的碳末端酰胺化多肽体系进行能量极小化,然后采用恒温器对溶剂化的碳末端酰胺化多肽体系进行NVT平衡,最后采用恒压器对溶剂化的碳末端酰胺化多肽分子体系进行NPT平衡;
[0023]其中,全原子分子动力学计算的一种优选方案是采用GROMACS软件;
[0024]步骤3:采用步骤2经过NPT平衡的溶剂化的碳末端酰胺化多肽体系,对碳末端酰胺化多肽进行原子水平的增强采样计算;
[0025]步骤3具体包含如下子步骤:
[0026]步骤3.1建立碳末端酰胺化多肽的全局集体坐标:天然原子关联分数和螺旋含量;
[0027]其中,天然原子关联分数和螺旋含量是基于步骤2的经过NPT平衡的碳末端酰胺化多肽结构建立;
[0028]其中,天然原子关联分数表述为如下公式(1):
[0029][0030]其中,i和j是碳末端酰胺化多肽中重原子的序号,r
ij
是增强构象采样计算过程中t时刻碳末端酰胺化多肽结构中重原子i和j的距离,是经过NPT平衡的碳末端酰胺化多肽结构中重原子i和j之间的实际距离,参数β的优选值为50,参数λ的优选值为1.8;
[0031]其中,天然原子关联分数的计算只考虑碳末端酰胺化多肽中的非相邻残基;
[0032]其中,螺旋含量表述为如下公式(2)和(3):
[0033][0034][0035]其中,n(RMSD)是切换函数,其值在0~1范围;Ω
α
是在碳末端酰胺化多肽中依次选取的6残基组;是6残基组Ω
α
的重原子坐标;{R0}是选取的6残基理想螺旋组的重原子坐标;RMSD是与{R0}之间的均方根误差;
[0036]步骤3.2在二维构象空间中,对碳末端酰胺化多肽进行全原子分子动力学和增强采样相结合的动力学计算,保存动力学计算获得的能量、轨迹和全局集体坐标;
[0037]其中,二维构象空间由步骤3.1的天然原子关联分数Q
N
和螺旋含量S
H
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种碳末端酰胺化多肽结构的动力学预测方法,包括以下步骤:(1)获取多肽的天然结构,基于多肽的天然结构构建碳末端酰胺化多肽的初始构象;(2)采用步骤(1)构建的碳末端酰胺化多肽的初始构象,进行全原子分子动力学的平衡处理;(3)采用步骤(2)经过平衡处理的碳末端酰胺化多肽体系,对碳末端酰胺化多肽进行原子水平的增强采样计算;(4)利用步骤(3)的增强采样计算获得的数据,重建碳末端酰胺化多肽的自由能,搜索自由能极小构象。优选地,其中步骤(1)在获得多肽的天然结构之后,构建碳末端酰胺化多肽的初始构象之前,还包括对获得的多肽的天然结构进行预处理的步骤。优选地,其中多肽的天然结构从蛋白质数据银行(PDB)下载。还优选地,其中预处理包括删除多肽的天然结构中的水分子、离子等无用的成分,检查多肽的天然结构是否存在残基和原子的缺失,补全缺失的残基和原子,如果多肽的天然结构仅包含重原子则添加氢原子。更优选地,其中构建碳末端酰胺化多肽的初始构象包括采用工具软件PdbViewer显示经过预处理的多肽的天然结构,找到碳末端氨基酸残基的羧基(

COOH),将羧基中的羟基(

OH)删除,编辑氨基(

NH2)构象并使氮原子与碳原子成键。2.根据权利要求1所述的方法,其中步骤(2)进一步包括:采用步骤(1)构建的碳末端酰胺化多肽的初始构象,选择全原子力场和水模型,生成拓扑文件,定义溶剂盒子的形状和大小,添加水分子和抗衡离子,先对溶剂化的碳末端酰胺化多肽体系进行能量极小化,然后采用恒温器对溶剂化的碳末端酰胺化多肽体系进行NVT平衡,最后采用恒压器对溶剂化的碳末端酰胺化多肽分子体系进行NPT平衡。优选地,其中全原子分子动力学平衡处理采用GROMACS软件进行。3.根据权利要求1

2中任一项所述的方法,其中步骤(3)进一步包括以下步骤:(a)基于步骤(2)的经过NPT平衡的碳末端酰胺化多肽结构,建立碳末端酰胺化多肽的全局集体坐标:即天然原子关联分数Q
N
和螺旋含量S
H
;(b)在二维构象空间中,对碳末端酰胺化多肽进行全原子分子动力学和增强采样相结合的动力学计算,保存动力学计算获得的能量、轨迹和全局集体坐标;(c)监测天然原子关联分数Q
N
和螺旋含量S
H
随时间的演化,适时停止动力学计算。优选地,其中天然原子关联分数表述为如下公式(1)其中,i和j是碳末端酰胺化多肽中重原子的序号,r
ij
是增强构象采样计算过程中t时刻碳末端酰胺化多肽结构中重原子i和j的距离,是经过NPT平衡的碳末端酰胺化多肽结构中重原子i和j之间的实际距离,参数β的优选值为50,参数λ的优选值为1.8;其中,天然原子关联分数的计算只考虑碳末端酰胺化多肽中的非相邻残基;其中,螺旋含量表述为如下公式(2)和(3):
其中,n(RMSD)是切换函数,其值在0~1范围;Ω
α
是在碳末端酰胺化多肽中依次选取的6残基组;是6残基组Ω
α
的重原子坐标;{R0}是选取的6残基理想螺旋组的重原子坐标;RMSD是与{R0}之间的均方根误差。更优选地,其中二维构象空间由天然原子关联分数Q
N
和螺旋含量S
H
构成。4.根据权利要求1

3中任一项所述的方法,其中动力学计算是在步骤(2)的全原子分子动力学的平衡处理的基础上进行;其中增强采样由历史依赖偏置势来驱动,历史依赖偏置势由高斯函数的求和来构建,表述为如下公式(4):。其中,c(x)为步骤3.1的全局集体坐标,x是碳末端酰胺化多肽中重原子的坐标,t是动力学计算的时间,ω为高斯函数的高度,δσ为高斯函数的宽度,τ
G
为高斯函数的沉积率。优选地,其中全原子分子动力学和增强采样相结合的动力学计算采用GROMACS与PLUMED软件进行。优选地,其中全原子分子动力学和增强采样相结合的动力学计算时,ω的值为0.1~1kJ/mol,δσ的值为天然原子关联分数Q
N
和螺旋含量S
H
变化范围的1%,τ
G
为每隔500~1000的全原子分子动力学时间步沉积一次高斯函数。更优选地,其中当天然原子关联分数Q
N
和螺旋含量S
H
达到步骤(1)的碳末端酰胺化多肽的初始构象的30%时停止动力学计算。5.根据权利要求1

4中任一项所述的方法,其中步骤(4)进一步包括以下步骤:利用增强构象采样计算获得的能量数据,以天然原子关联分数和螺旋含量为坐标轴重建碳末端酰胺化多肽的自由能曲面,在自由能曲面上搜索自由能极小,确定自由能极小对应的天然原子关联分数和螺旋含量的值,进而在获得的轨迹中找到并提取自由能极小对应的结构,即为预测的碳末端酰胺化多肽结构。6.一种碳末端酰胺化多肽结构的动力学预测装置,包括以下模块:(1)获取和构建模块,用于获取多肽的天然结构,基于多肽的天...

【专利技术属性】
技术研发人员:李静何建锋梁国龍樊欣迎刘月峰闻亚磊
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1