基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置制造方法及图纸

技术编号:33536374 阅读:24 留言:0更新日期:2022-05-19 02:18
本发明专利技术属于生物信息分析领域,公开了一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置。本发明专利技术针对传统的蛋白质结构预测方法在构建信号肽的结构上存在的困难,提供了一种能够方便操作、准确性高的从头算建模方法和装置,具有非常好的实用价值。具有非常好的实用价值。具有非常好的实用价值。

【技术实现步骤摘要】
基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置


[0001]本专利技术涉及一种信号肽的特异性设计与结构建模方法和装置,尤其涉及一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置,属于短肽的设计、生物信息学和分子动力学领域。

技术介绍

[0002]信号肽是分泌蛋白质中引导蛋白质穿膜转移的氮端氨基酸序列。信号肽由三个区域组成:N端N区(1

5个氨基酸)通常包含一个或多个氨基酸,带正电荷;位于中间的H区主要由7

15个氨基酸组成,其中许多是疏水性的,以中性氨基酸为主,是信号肽的功能区;C区一般由3

7个氨基酸组成,在切割位点前的

1和

3位,多为中性短链氨基酸,是信号肽加工区,信号序列切割位点位于此区。研究表明,信号肽能够指导蛋白质多肽链在细胞内的输运与转移。在信号肽的引导下,合成过程中的蛋白质通过由核糖体大亚基的中央管和转运体易位蛋白形成的通道而穿膜进入内质网腔,随后信号肽被内质网腔中的信号肽酶切除。由于能将附加的蛋白质转运进细胞膜,信号肽已广泛用于生物工程和医药生产等领域。例如,利用大肠杆菌系统,在外源基因的N端融合一段细菌蛋白的疏水信号肽,如OmpA、OmpF、PelB等,可将目标蛋白运送到周质腔,便于分离和纯化。有研究发现,OmpA信号肽序列的微小不同,都可能影响膜外成熟OmpA的前体蛋白合成水平和组装水平,从而影响蛋白的生产水平,造成这种结果的原因尚不清楚。实际应用中,考虑到合成、水解、稳定性等因素,人们期望获得生物学性质更好的信号肽。这些需求促使我们去探索新的策略和设计更好的信号肽。
[0003]蛋白质的结构决定其生物学功能。深入地理解含有信号肽序列的分泌蛋白质的折叠、迁移和穿膜等功能机制,首先需要确定其空间结构。晶体衍射、冷冻电镜和核磁共振等技术可以解析分泌蛋白的结构。然而,到目前为止,解析的大多数是酶切后的分泌蛋白,通常缺少氮端的信号肽。因而,根据氨基酸序列构建这些缺失的信号肽结构非常必要。信号肽属于短肽,一般由15~30个氨基酸组成。在生理环境中,信号肽极少折叠成三级结构,常形成含有helix的二级结构。传统的蛋白质结构预测方法,如同源建模和Threading,构建信号肽的结构存在一些困难。因而,迫切需要发展一种针对信号肽特性的“从头算”建模技术。
[0004]本专利技术致力于解决上述信号肽研究和应用领域迫切需要解决的问题,提出了基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置。本专利技术提出了基于天然氨基酸序列设计信号肽的策略,设计了几种新的信号肽,并提出了基于序列的信号肽的从头算建模技术,本专利技术将对信号肽的设计与建模具有实用价值。

技术实现思路

[0005]本专利技术的目的是针对目前缺乏好的信号肽设计策略和高效的结构建模技术的现状,提出了一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置。
[0006]本专利技术所述方法基于目标蛋白质的信号肽的天然氨基酸序列,通过改变中间功能
区的氨基酸来设计新型的信号肽的氨基酸序列,采用基于生物信息学的从头算方法预测这些信号肽的二级结构,然后以预测的结构为初始构象在溶剂环境中对信号肽进行分子动力学模拟,从轨迹中获取它们的稳定结构。
[0007]为此,本专利技术一方面提供了一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法,包括以下步骤:
[0008]1、获取目标蛋白质的信号肽的天然氨基酸序列;
[0009]2、根据目标蛋白质的信号肽的天然氨基酸序列,设计目标蛋白质的新型的信号肽氨基酸序列;
[0010]3、构建目标蛋白质的信号肽和新型信号肽的初始构象,进行分子动力学模拟;
[0011]4、提取目标蛋白质的信号肽和新型信号肽的稳定结构。
[0012]为达到上述目的,本专利技术采取如下技术方案。
[0013]所述基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法,包括以下步骤:
[0014]步骤1:获取目标蛋白质的信号肽的天然氨基酸序列;
[0015]其中,目标蛋白质的信号肽的天然氨基酸序列从序列数据库UniProt下载;
[0016]步骤2:根据目标蛋白质的信号肽的天然氨基酸序列,设计目标蛋白质的新型的信号肽氨基酸序列,具体为:
[0017]根据目标蛋白质的信号肽的天然氨基酸序列,保持其氮端和碳端的带电氨基酸不变,改变中间功能区的氨基酸,获得目标蛋白质的新型的信号肽氨基酸序列;
[0018]步骤3:构建目标蛋白质的信号肽和新型信号肽的初始构象,进行分子动力学模拟;
[0019]步骤3具体包含如下子步骤:
[0020]步骤3.1构建目标蛋白质的信号肽和新型信号肽的初始构象,具体为:
[0021]基于步骤1的信号肽的天然氨基酸序列和步骤2的新型信号肽的氨基酸序列,采用基于生物信息学的从头算方法,构建目标蛋白质的信号肽和新型信号肽的初始构象;
[0022]其中,基于生物信息学的从头算方法的一种优选方案是采用多肽结构预测PEP

FOLD3方法;
[0023]步骤3.2对目标蛋白质的信号肽和新型信号肽进行溶剂化,具体为:
[0024]采用步骤3.1构建的目标蛋白质的信号肽和新型信号肽的初始构象,选择合适的力场和水模型,生成体系的拓扑文件,定义溶剂盒子的形状和大小,给溶剂盒子加水分子,添加抗衡离子,设置盐浓度;
[0025]其中,所述力场的一种优选方案是Charmm36力场,水模型的一种优选方案为TIP3P;
[0026]其中,所述溶剂盒子的一种优选方案是立方体盒子,盒子的大小的一种优选方案为盒子边界离蛋白质距离为
[0027]其中,所述抗衡离子的优选方案为Na
+
和Cl

,使目标蛋白质的信号肽和新型信号肽体系呈电中性;
[0028]其中,所述盐浓度的一种优选方案为150mMol的NaCl;
[0029]步骤3.3对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行能量极小化;
[0030]其中,能量极小化的一种优选方案为采用最速下降算法,适当设置能量极小化的步数,确保能量极小化后原子间作用力小于1000kJ/mol nm;
[0031]步骤3.4在步骤3.3的基础上,采用恒温器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NVT平衡;
[0032]其中,恒温器的一种优选方案为修正的Berendsen恒温器,温度的一种优选方案为310K,NVT平衡时间的一种优选方案为大于等于100ps;
[0033]步骤3.5在步骤3.4的基础上,采用恒压器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NPT平衡;
[0034]其中,恒压器的一种优选方案为Parrinello

Rahman耦合器,压强的一种优选方案为1.0bar,NPT平衡时间的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法,包括以下步骤:(1)获取目标蛋白质的信号肽的天然氨基酸序列;(2)根据目标蛋白质的信号肽的天然氨基酸序列,设计目标蛋白质的新型的信号肽氨基酸序列;(3)构建目标蛋白质的信号肽和新型信号肽的初始构象,进行分子动力学模拟;(4)提取目标蛋白质的信号肽和新型信号肽的稳定结构。2.根据权利要求1所述的方法,其中步骤(3)包括以下步骤:(a)基于步骤(1)的信号肽的天然氨基酸序列和步骤(2)的新型信号肽的氨基酸序列,基于生物信息学的从头算方法,构建目标蛋白质的信号肽和新型信号肽的初始构象;(b)对目标蛋白质的信号肽和新型信号肽进行溶剂化;(c)对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行能量极小化;(d)在步骤(c)的基础上,采用恒温器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NVT平衡;(e)在步骤(d)的基础上,采用恒压器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NPT平衡;(f)在步骤(e)的基础上,对溶剂化的目标蛋白质的信号肽和新型信号肽进行长时间的分子动力学计算,存储体系的坐标、速度、能量等数据。优先地,其中步骤(2)采用如下的方式:根据目标蛋白质的信号肽的天然氨基酸序列,保持其氮端和碳端的带电氨基酸不变,改变中间功能区的氨基酸,获得目标蛋白质的新型的信号肽氨基酸序列。优选地,其中步骤(a)中所述的基于生物信息学的从头算方法是采用多肽结构预测PEP

FOLD3方法。还优选地,其中步骤(b)采用如下的方式:采用步骤(a)构建的目标蛋白质的信号肽和新型信号肽的初始构象,选择合适的力场和水模型,生成体系的拓扑文件,定义溶剂盒子的形状和大小,给溶剂盒子加水分子,添加抗衡离子,设置盐浓度。更优选地,其中力场是Charmm36力场;水模型为TIP3P;溶剂盒子为立方体盒子,盒子边界离蛋白质距离为抗衡离子为Na
+
和Cl

,使目标蛋白质的信号肽和新型信号肽体系呈电中性;盐浓度为150mMol的NaCl。3.根据权利要求1

2中任一项所述的方法,其中步骤(c)中能量极小化采用最速下降算法,适当设置能量极小化的步数,确保能量极小化后原子间作用力小于1000kJ/mol nm。优选地,其中步骤(d)中的恒温器为修正的Berendsen恒温器,温度为310K,NVT平衡时间为大于等于100ps。优选地,其中步骤(e)中的恒压器为Parrinello

Rahman耦合器,压强为1.0bar,NPT平衡时间为大于等于100ps。优选地,其中步骤(f)中的分子动力学计算在NPT系综中进行,其温度、压强保持与步骤(e)的NPT平衡相同;分子动力学计算过程中存储体系的坐标、速度、能量等数据的时间间隔
为小于等于10ps;分子动力学计算时间的选取需确保目标蛋白质的信号肽和新型信号肽的构象趋于稳定。4.根据权利要求1

3中任一项所述的方法,其中步骤(4)采用如下的方式:基于步骤(f)分子动力学计算的数据,分析目标蛋白质的信号肽和新型信号肽的构象时间演化特征,确定稳定性好、含α

helix结构的时间区域,从该时间区域提取代表性结构,即为最终构建的目标蛋白质的信号肽和新型信号肽的结构。优选地,其中分析目标蛋白质的信号肽和新型信号肽的构象时间演化特征是监测目标蛋白质的信号肽和新型信号肽中的α

helix含量和相对于初始构象的RMSD随时间的变化;确定稳定性好、含α

helix结构的时间区域是通过α

helix含量和相对于初始构象RMSD随时间的演化来找寻波动幅度较小、稳定时间较长的区域。5.根据权利要求1

4任一项所述的方法,其中α

helix含量表述为如下公式(1):式中,K0是步骤(a)构建的初始构象中α

helix的氨基酸数目,K(t)是步骤(f)分子动力学计算的t时刻构象中α

helix的氨基酸数目,Hα的数值在[0,1]之间。其中,RMSD表述为如下公式(2):式中,N是目标蛋白质的信号肽和新型信号肽的中心碳原子总数,i是中心碳原子的序号,i为1到N的整数,X
i
是步骤(a)构建的初始构象中第i个中心碳原子的坐标,Y
i
是步骤(f)分子动力学计算的t时刻构象中第i个中心碳原子的坐标。优选地,其中目标蛋白质为外膜蛋白A,其信号肽的氨基酸序列为附图5所示的ompA信号肽序列,信号肽的结构如附图8所示,其新型的信号肽的氨基酸序列如附图5的设计1

7所示,新型信号肽的结构如附图8所示。6.一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模装置,包括以下模块:(1)获取模块,用于获取目标蛋白质的信号肽的天然氨基酸序列;...

【专利技术属性】
技术研发人员:李静何建锋梁国龍刘月峰周凤丽樊欣迎闻亚磊
申请(专利权)人:北京理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1