当前位置: 首页 > 专利查询>南通大学专利>正文

一种基于蛋白质空间结构的二硫键预测方法技术

技术编号:24173752 阅读:87 留言:0更新日期:2020-05-16 03:51
本发明专利技术提供一种基于蛋白质空间结构的二硫键预测方法,包括如下步骤:(1)输入待进行二硫键预测的蛋白质序列信息,使用SWISS‑MODEL服务器获取目的蛋白质的结构信息;(2)把所有与目的蛋白相关的结构列出,选择与其序列类似度最高的蛋白结构作为目的蛋白结构;(3)围绕目的蛋白结构,列出所有半胱氨酸的硫原子的空间位置坐标;(4)根据距离临界值判断标准预测某一对半胱氨酸侧链硫原子之间是否形成二硫键,并把目的蛋白结构中所有形成二硫键的半胱氨酸对列出,包括其侧链硫原子间距。本发明专利技术直接从二硫键的化学定义出发,提供一种基于蛋白质空间结构的二硫键预测方法,其准确性与测定蛋白质空间结构的实验方法的准确性完全一致。

【技术实现步骤摘要】
一种基于蛋白质空间结构的二硫键预测方法
本专利技术涉及生物信息学、结构生物学与计算机应用领域,具体涉及一种基于蛋白质空间结构的二硫键预测方法。
技术介绍
二硫键是在相同或不同蛋白质多肽链上的两个半胱氨酸残基之间形成的稳定共价键,对蛋白质的正确折叠和结构稳定性起重要作用。因此,精确地预测蛋白质结构中的二硫键,有助于深入研究蛋白质结构及分子动力学属性、揭示其构象关系、注释蛋白质功能,具有重要的生物学意义。文献查询表明:一系列用于预测蛋白质二硫键的方法已被提出,如:1、DISULFIND:adisulfidebondingstateandcysteineconnectivitypredictionserver(一个二硫键连接状态和半胱氨酸连接预测服务器),于2006年出版于NucleicAcidResearch.2、DisulfideConnectivityPredictionBasedonModelledProtein3DStructuralInformationandRandomForestRegression(基于蛋白三维结构建模与随机森林回归的二硫键连接预测),于2015年出版于IEEE/ACM计算生物学和生物信息学会刊。3、Accuratedisulfide-bondingnetworkpredictionsimproveabinitiostructurepredictionofcysteine-richproteins(精确预测二硫键用于提升富含半胱氨酸蛋白结构的从头预测精度),于2015年出版于Bioinformatics(生物信息学)杂志。4、pSSbond-PseAAC:PredictionofdisulfidebondingsitesbyintegrationofPseAACandstatisticalmoments(pSSbond-PseAAC:利用PseAAC:和统计矩的方法预测二硫键合位点),于2019年出版于理论生物学杂志。除此以外,最近我们国家也有新的专利申请(申请号:201910311799.9),提出一种基于多序列联配信息的蛋白质二硫键预测方法,这个方法提供一种计算代价低、预测精度高的基于多序列联配信息的蛋白质二硫键预测方法。尽管如此,目前的二硫键预测方法存在的缺陷包括:1、从蛋白质序列出发预测蛋白质结构内的二硫键。从进化的角度看,结构比序列更加保守。从描述的维度看,蛋白质结构是三维的,而蛋白质序列是一维的,显然前者更接近客观真实。其次,即使预测出了二硫键,也只能从一维、或者二维的层面描述蛋白质结构内部的二硫键形成的模式图,而不是把二硫键本身映射(如摘要附图所示)到蛋白质空间结构本身,因此,无法直观、客观地表征二硫键对于蛋白质结构本身的稳定性及其及分子动力学属性(如摘要附图所示)。2、从蛋白质三维结构建模出发预测蛋白质结构内的二硫键。和实验测定蛋白质三维结构比,由于蛋白质三维结构建模本身具有先天的缺陷,属于分子结构模拟研究,因此,从蛋白质三维结构建模出发预测蛋白质结构内的二硫键的准确性不可避免的要劣于从实验测定的蛋白质三维结构预测蛋白质结构内的二硫键的准确性。综上所述,目前已有的蛋白质二硫键预测方法在预测准确度、表征维度两个方面的不足,有待进一步改进。因此,本专利技术从高准确度、高维度表征两个方面出发,提出一种基于蛋白质空间结构的二硫键预测方法。
技术实现思路
本专利技术要解决的技术问题是一种基于蛋白质空间结构的二硫键预测方法,计算代价低,可以高通量地鉴定出蛋白质内部的二硫键等,并且其准确性与目前世界公认的蛋白质三维结构测定方法(X-射线衍射、核磁共振(包括液态与固态)与冷冻电镜技术)的准确性完全一致。本专利技术提供一种基于蛋白质空间结构的二硫键预测方法,包括如下步骤:(1)输入待进行二硫键预测的蛋白质序列信息,使用SWISS-MODEL服务器获取目的蛋白质的结构信息;(2)把所有与目的蛋白相关的结构列出,选择与其序列类似度最高的蛋白结构作为目的蛋白结构;(3)围绕目的蛋白结构,列出所有半胱氨酸的硫原子的空间位置坐标;(4)根据距离临界值判断标准预测某一对半胱氨酸侧链硫原子之间是否形成二硫键,并把目的蛋白结构中所有形成二硫键的半胱氨酸对列出,包括其侧链硫原子间距。其中,步骤(3)中,半胱氨酸1侧链硫原子A的坐标为[x1,y1,z1],半胱氨酸2侧链硫原子B的坐标为[x2,y2,z2],根据这些坐标计算出所有AB的原子对之间的空间距离d(A,B),具体公式如下:。本专利技术的技术方案的有益效果如下:上述方案中,计算代价低,可以自动化的批量鉴定出蛋白质内部的二硫键、氢键、盐桥等等,并且其准确性与测定蛋白质空间结构的方法的准确性一致。附图说明图1为本专利技术的工作流程图;图2为本专利技术实施例一中使用SWISS-MODEL服务器获取目的蛋白质的结构信息的示意图;图3为本专利技术实施例一中通过SWISS-MODEL同源模拟服务器获取的蛋白质结构信息的结果图;图4为本专利技术实施例一中选择与其序列类似度最高的蛋白结构作为目的蛋白结构的结果图;图5为本专利技术实施例一中PDB数据库的唯一标识码2js9,从PDB数据库中查询的结果图;图6为本专利技术实施例一中所有相关的原子对之间的空间距离示意图;图7为本专利技术实施例一中Caenopore-5的液态核磁共振测定的三维结构图;图8为本专利技术实施例一中对所有与Caenopore-5有关的或者同源的蛋白质结构进行批量二硫键预测的结果图。具体实施方式为使本专利技术要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。在自然界,存在多种多样的物种,包括动物、植物、微生物,甚至病毒,同时,同一物种的蛋白质组成也具有非常丰富的多样性,甚至一个基因本身也会由于信使RNA剪接方式的不同而存在多种剪接体(也即是多种蛋白质产物),因此,目前为止,PDB(https://www.rcsb.org/)数据库虽然已经存放了15万个生物大分子结构,但是其尚未覆盖自然界所有的蛋白质结构。不过,这并不妨碍本专利技术提出一种基于蛋白质空间结构的二硫键预测方法。需要特别注意的是,下文所有关于具体方法步骤的描述均包含一个关键假设:目的蛋白质的结构已经通过实验技术(X-射线衍射、核磁共振(包括液态与固态)与冷冻电镜技术)测定,并且已经存放在PDB(https://www.rcsb.org/)数据库。如图1所示,本专利技术提供了一种基于蛋白质空间结构的二硫键预测方法,包括如下步骤:(1)输入待进行二硫键预测的蛋白质序列信息,使用SWISS-MODEL服务器获取目的蛋白质的结构信息;(2)把所有与目的蛋白相关的结构列出,选择与其序列类似度(也即是序列同源度,下文会详细描述)最高的蛋白结构作为目的蛋白结构;(3)围绕目的蛋白结构,列出所有半胱氨酸的硫原子的空间位本文档来自技高网
...

【技术保护点】
1.一种基于蛋白质空间结构的二硫键预测方法,其特征在于,包括如下步骤:/n(1)输入待进行二硫键预测的蛋白质序列信息,使用SWISS-MODEL服务器获取目的蛋白质的结构信息;/n(2)把所有与目的蛋白相关的结构列出,选择与其序列类似度最高的蛋白结构作为目的蛋白结构;/n(3)围绕目的蛋白结构,列出所有半胱氨酸的硫原子的空间位置坐标;/n(4)根据距离临界值判断标准预测某一对半胱氨酸侧链硫原子之间是否形成二硫键,并把目的蛋白结构中所有形成二硫键的半胱氨酸对列出,包括其侧链硫原子间距。/n

【技术特征摘要】
1.一种基于蛋白质空间结构的二硫键预测方法,其特征在于,包括如下步骤:
(1)输入待进行二硫键预测的蛋白质序列信息,使用SWISS-MODEL服务器获取目的蛋白质的结构信息;
(2)把所有与目的蛋白相关的结构列出,选择与其序列类似度最高的蛋白结构作为目的蛋白结构;
(3)围绕目的蛋白结构,列出所有半胱氨酸的硫原子的空间位置坐标;
(4)根据距离临界值判断标准预测某一对半胱氨酸侧链...

【专利技术属性】
技术研发人员:李炜
申请(专利权)人:南通大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1