【技术实现步骤摘要】
基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置
[0001]本专利技术涉及一种信号肽的特异性设计与结构建模方法和装置,尤其涉及一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法和装置,属于短肽的设计、生物信息学和分子动力学领域。
技术介绍
[0002]信号肽是分泌蛋白质中引导蛋白质穿膜转移的氮端氨基酸序列。信号肽由三个区域组成:N端N区(1
‑
5个氨基酸)通常包含一个或多个氨基酸,带正电荷;位于中间的H区主要由7
‑
15个氨基酸组成,其中许多是疏水性的,以中性氨基酸为主,是信号肽的功能区;C区一般由3
‑
7个氨基酸组成,在切割位点前的
‑
1和
‑
3位,多为中性短链氨基酸,是信号肽加工区,信号序列切割位点位于此区。研究表明,信号肽能够指导蛋白质多肽链在细胞内的输运与转移。在信号肽的引导下,合成过程中的蛋白质通过由核糖体大亚基的中央管和转运体易位蛋白形成的通道而穿膜进入内质网腔,随后信号肽被内质网腔中的信号肽酶切除。由于能将附加的蛋白质转运进细胞膜,信号肽已广泛用于生物工程和医药生产等领域。例如,利用大肠杆菌系统,在外源基因的N端融合一段细菌蛋白的疏水信号肽,如OmpA、OmpF、PelB等,可将目标蛋白运送到周质腔,便于分离和纯化。有研究发现,OmpA信号肽序列的微小不同,都可能影响膜外成熟OmpA的前体蛋白合成水平和组装水平,从而影响蛋白的生产水平,造成这种结果的原因尚不清楚。实际应用中,考虑到合成、水解、 ...
【技术保护点】
【技术特征摘要】
1.一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模方法,包括以下步骤:(1)获取目标蛋白质的信号肽的天然氨基酸序列;(2)根据目标蛋白质的信号肽的天然氨基酸序列,设计目标蛋白质的新型的信号肽氨基酸序列;(3)构建目标蛋白质的信号肽和新型信号肽的初始构象,进行分子动力学模拟;(4)提取目标蛋白质的信号肽和新型信号肽的稳定结构。2.根据权利要求1所述的方法,其中步骤(3)包括以下步骤:(a)基于步骤(1)的信号肽的天然氨基酸序列和步骤(2)的新型信号肽的氨基酸序列,基于生物信息学的从头算方法,构建目标蛋白质的信号肽和新型信号肽的初始构象;(b)对目标蛋白质的信号肽和新型信号肽进行溶剂化;(c)对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行能量极小化;(d)在步骤(c)的基础上,采用恒温器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NVT平衡;(e)在步骤(d)的基础上,采用恒压器对溶剂化的目标蛋白质的信号肽和新型信号肽体系进行NPT平衡;(f)在步骤(e)的基础上,对溶剂化的目标蛋白质的信号肽和新型信号肽进行长时间的分子动力学计算,存储体系的坐标、速度、能量等数据。优先地,其中步骤(2)采用如下的方式:根据目标蛋白质的信号肽的天然氨基酸序列,保持其氮端和碳端的带电氨基酸不变,改变中间功能区的氨基酸,获得目标蛋白质的新型的信号肽氨基酸序列。优选地,其中步骤(a)中所述的基于生物信息学的从头算方法是采用多肽结构预测PEP
‑
FOLD3方法。还优选地,其中步骤(b)采用如下的方式:采用步骤(a)构建的目标蛋白质的信号肽和新型信号肽的初始构象,选择合适的力场和水模型,生成体系的拓扑文件,定义溶剂盒子的形状和大小,给溶剂盒子加水分子,添加抗衡离子,设置盐浓度。更优选地,其中力场是Charmm36力场;水模型为TIP3P;溶剂盒子为立方体盒子,盒子边界离蛋白质距离为抗衡离子为Na
+
和Cl
‑
,使目标蛋白质的信号肽和新型信号肽体系呈电中性;盐浓度为150mMol的NaCl。3.根据权利要求1
‑
2中任一项所述的方法,其中步骤(c)中能量极小化采用最速下降算法,适当设置能量极小化的步数,确保能量极小化后原子间作用力小于1000kJ/mol nm。优选地,其中步骤(d)中的恒温器为修正的Berendsen恒温器,温度为310K,NVT平衡时间为大于等于100ps。优选地,其中步骤(e)中的恒压器为Parrinello
‑
Rahman耦合器,压强为1.0bar,NPT平衡时间为大于等于100ps。优选地,其中步骤(f)中的分子动力学计算在NPT系综中进行,其温度、压强保持与步骤(e)的NPT平衡相同;分子动力学计算过程中存储体系的坐标、速度、能量等数据的时间间隔
为小于等于10ps;分子动力学计算时间的选取需确保目标蛋白质的信号肽和新型信号肽的构象趋于稳定。4.根据权利要求1
‑
3中任一项所述的方法,其中步骤(4)采用如下的方式:基于步骤(f)分子动力学计算的数据,分析目标蛋白质的信号肽和新型信号肽的构象时间演化特征,确定稳定性好、含α
‑
helix结构的时间区域,从该时间区域提取代表性结构,即为最终构建的目标蛋白质的信号肽和新型信号肽的结构。优选地,其中分析目标蛋白质的信号肽和新型信号肽的构象时间演化特征是监测目标蛋白质的信号肽和新型信号肽中的α
‑
helix含量和相对于初始构象的RMSD随时间的变化;确定稳定性好、含α
‑
helix结构的时间区域是通过α
‑
helix含量和相对于初始构象RMSD随时间的演化来找寻波动幅度较小、稳定时间较长的区域。5.根据权利要求1
‑
4任一项所述的方法,其中α
‑
helix含量表述为如下公式(1):式中,K0是步骤(a)构建的初始构象中α
‑
helix的氨基酸数目,K(t)是步骤(f)分子动力学计算的t时刻构象中α
‑
helix的氨基酸数目,Hα的数值在[0,1]之间。其中,RMSD表述为如下公式(2):式中,N是目标蛋白质的信号肽和新型信号肽的中心碳原子总数,i是中心碳原子的序号,i为1到N的整数,X
i
是步骤(a)构建的初始构象中第i个中心碳原子的坐标,Y
i
是步骤(f)分子动力学计算的t时刻构象中第i个中心碳原子的坐标。优选地,其中目标蛋白质为外膜蛋白A,其信号肽的氨基酸序列为附图5所示的ompA信号肽序列,信号肽的结构如附图8所示,其新型的信号肽的氨基酸序列如附图5的设计1
‑
7所示,新型信号肽的结构如附图8所示。6.一种基于天然氨基酸序列的信号肽设计与二级结构从头算建模装置,包括以下模块:(1)获取模块,用于获取目标蛋白质的信号肽的天然氨基酸序列;...
【专利技术属性】
技术研发人员:李静,何建锋,梁国龍,刘月峰,周凤丽,樊欣迎,闻亚磊,
申请(专利权)人:北京理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。