【技术实现步骤摘要】
一种蛋白骨架设计方法及其应用
[0001]本专利技术属于生物
,具体涉及一种蛋白骨架计算设计方法及其应用。
技术介绍
[0002]目前,使用晶体结构的蛋白质片段或晶体结构的二级结构单元进行随机组装,生成有特定折叠模式的蛋白质结构以及序列。现有的骨架生成方法效率较低,得到的蛋白质结构模型质量参差不齐,需要大量的人工检查和参数评定,对数据库进行过滤,费时费力,人为视觉检查标准无法统一。并且在设计靶向结合的小蛋白时,经常匹配不到合适的小蛋白骨架模板,因此增加可用的小蛋白骨架数据是必要的。
技术实现思路
[0003]因此,本专利技术提供一种改进的小蛋白骨架设计方法,可以组装生成大量能够稳定折叠的蛋白作为靶向结合小蛋白的结构模板,该设计方法可克服当前的模板数量不足的问题,并使用提出的新的过滤标准实现自动化过滤,得到较高质量、稳定性数据较好的蛋白质骨架模型。
[0004]具体技术方案为:一种小蛋白骨架的设计方法,包括以下步骤:步骤(1),创建新的蛋白质数据库,从PDB数据库中将解析精度在3.0
Å< ...
【技术保护点】
【技术特征摘要】
1.一种小蛋白骨架的设计方法,包括以下步骤:S1:创建新的结构片段数据库,从PDB数据库中将解析精度在3.0
Å
以下,小于30%序列相似的非冗余数据提取作为数据的输入集,将每段螺旋长度为5-25个氨基酸长度的HLH 片段进行分离,制备成新的数据库,以此将螺旋结构的大小控制在30-90个氨基酸区间;S2: 生成小蛋白骨架数据库,采用改进的SEWING方法,通过图路径与蒙特卡洛的搜索方法,不断地将S1新建的蛋白质数据库中的HLH 片段进行随机组装,得到大量的粗粒化骨架模型,并使用新制定的结构特征指标对骨架模型进行初次过滤,形成小蛋白骨架数据库;S3:对小蛋白骨架进行氨基酸序列优化和设计,使用Rosetta FastDesign Mover对小蛋白骨架数据库中的小蛋白的氨基酸序列和侧链原子进行设计和能量优化,然后多次设计迭代形成新的蛋白序列结构;S4:采用与稳定性相关的指标对结构进行评价和过滤,不满足标准的结构将被移除过滤,最终形成计算预测上能够稳定折叠的小蛋白。2.如权利要求1所述的设计方法,其特征在于,所述S2中,所述的改进的SEWING方法为:S21:通过图路径与蒙特卡洛的搜索方法,将每个HLH片段作为图路径搜索中的一个节点,将能够与该HLH结构吻合匹配的片段作为邻近的节点;S22:随机地从一个节点进行出发,随机地选择相邻的节点进行结构组装,当满足新制定的结构特征指标时,保留此结构模型用于进一步的氨基酸设计。3.如权利要求1所述的设计方法,其特征在于,所述S2中,所述的结构特征指标包括:(1):通过统计每段螺旋上氨基酸Cα原子与其他螺旋上每一个氨基酸的Cα原子之间的距离,使该距离为4.5-6.0
Å
时;(2):在生成过程中,要求位于N段和C段的螺旋结构长度不得低于7个氨基酸;(3):通过统计每段螺旋结构的几何中心与蛋白结构的质量中心结构的距离,该距离不得大于7.5
Å
。4.如权利要求2所述的设计方法,其特征在于,所述S21中,在迭代50,000-1...
【专利技术属性】
技术研发人员:王天元,吴炜坤,赖力鹏,温书豪,马健,
申请(专利权)人:北京晶派科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。