一种蛋白质三维构型数据储存方法技术

技术编号:37852064 阅读:16 留言:0更新日期:2023-06-14 22:43
本发明专利技术属于生物信息技术领域,具体公开了一种蛋白质三维构型数据储存方法,包括如下步骤:所述数据储存方法应用在本地储存数据库中,所述本地储存数据库与蛋白在线数据库之间建立数据下载通道;通过所述数据下载通道,从所述蛋白在线数据库中获取与请求数据相匹配的文件;将所述文件加载至预设储存位置,本发明专利技术通过设置的多种空间坐标系对蛋白质数据进行储存可以对蛋白质内部的不同结构进行准确记录,方便后续进行使用,通过设置的蛋白指纹可以对蛋白空间信息及理化性质进行方便的记录,便于根据蛋白区间对蛋白质之间的相互作用关系进行预测,提高对致病机理方面的研究效率。率。率。

【技术实现步骤摘要】
一种蛋白质三维构型数据储存方法


[0001]本专利技术涉及一种蛋白质三维构型数据储存方法,属于生物信息


技术介绍

[0002]蛋白质组的概念最先由Marc Wilkins提出,指由一个基因组,或一个细胞、组织表达的所有蛋白质。蛋白质组的概念与基因组的概念有许多差别,它随着组织、甚至环境状态的不同而改变。在转录时,一个基因可以多种mRNA形式剪接,并且,同一蛋白可能以许多形式进行翻译后的修饰。故一个蛋白质组不是一个基因组的直接产物,蛋白质组中蛋白质的数目有时可以超过基因组的数目。蛋白质组学处于早期“发育”状态,这个领域的专家否认它是单纯的方法学,就像基因组学一样,不是一个封闭的、概念化的稳定的知识体系,而是一个领域。蛋白质组学集中于动态描述基因调节,对基因表达的蛋白质水平进行定量的测定,鉴定疾病、药物对生命过程的影响,以及解释基因表达调控的机制。作为一门科学,蛋白质组研究并非从零开始,它是已有20多年历史的蛋白质(多肽)谱和基因产物图谱技术的一种延伸。多肽图谱依靠双向电泳和进一步的图象分析;而基因产物图谱依靠多种分离后的分析,如质谱技术、氨基酸组分分析等。蛋白质组学的研究试图比较细胞在不同生理或病理条件下蛋白质表达的异同,对相关蛋白质进行分类和鉴定。更重要的是蛋白质组学的研究要分析蛋白质间相互作用和蛋白质的功能。蛋白质之间的相互作用是大多数病毒的致病方式,病毒通过自身编码的蛋白质与寄主蛋白进行结合,从而改变寄主蛋白上游或下游蛋白的编码,从而使蛋白的相应功能受到影响。现有的蛋白质数据储存方法较为简单,仅能通过已知的蛋白质之间的相互作用进行查询,无法对蛋白质之间的相互作用进行预测。

技术实现思路

[0003]本专利技术的目的在于提供一种蛋白质三维构型数据储存方法,解决上述
技术介绍
中提出的问题。
[0004]为实现上述目的,本专利技术提供如下技术方案:一种蛋白质三维构型数据储存方法,包括如下步骤:
[0005]所述数据储存方法应用在本地储存数据库中,所述本地储存数据库与蛋白在线数据库之间建立数据下载通道;
[0006]通过所述数据下载通道,从所述蛋白在线数据库中获取与请求数据相匹配的文件;
[0007]将所述文件加载至预设储存位置。
[0008]优选的,建立与所述文件长度相同的数据表S(i,j),所述数据表S包括行地址i和列地址j,所述行地址i代表储存数据,所述列地址j代表数据信息名称。
[0009]优选的,将所述文件数据依次储存至数据表S中;
[0010]其中:
[0011]所述数据表S第一行S(i,0)用于储存蛋白质的氨基酸序列,所述序列通过氨基酸
缩写进行储存
[0012]所述数据表S第二行S(i,1)至第四行(i,3)依次储存相应氨基酸的空间坐标(x,y,z),
[0013]所述数据表S第五行S(i,4)至第九行S(i,8)用于储存蛋白指纹。
[0014]优选的,所述蛋白指纹是将蛋白质以12个氨基酸长度为一个单位进行分割,使蛋白形成相应的氨基酸区间,并以[1,k]依次储存,其中k=(氨基酸长度/12)+1。
[0015]优选的,所述蛋白指纹数据包括形状指数,泊松

玻尔兹曼静电数值,氢键电位,疏水性以及测地坐标系。
[0016]优选的,所述形状指数描述了表面上每个氨基酸周围的形状,其数值范围从

1(高度凹)到+1(高度凸);
[0017]所述形状指数定义为:
[0018][0019]其中k1,k2为该氨基酸与两侧氨基酸之间的曲率,k1≥k2。
[0020]优选的,所述泊松

玻尔兹曼静电数值为单个氨基酸在该点处的电荷量V。
[0021]优选的,所述氢键电位使用氢键电位作为参考计算分子表面中自由电子和潜在氢键供体的位置,并以数值

1(氢键受体的最佳位置)到+1(氢键供体的最佳位置)进行表示。
[0022]优选的,所述疏水性表示根据侧链基团的极性或在生理pH(接近pH=7.0)下与水相互作用的趋势,以数值[

1,1]进行表示。
[0023]优选的,所述测地坐标系用于表示相较于氨基酸区间顶点在径向(即距中心的测地线距离)和角坐标(即相对于随机方向的角度)的位置与氨基酸区间的中心的值。
[0024]与现有技术相比,本专利技术的有益效果是:
[0025]本专利技术属于生物信息
,具体公开了一种蛋白质三维构型数据储存方法,本专利技术通过设置的多种空间坐标系对蛋白质数据进行储存可以对蛋白质内部的不同结构进行准确记录,方便后续进行使用,通过设置的蛋白指纹可以对蛋白空间信息及理化性质进行方便的记录,便于根据蛋白区间对蛋白质之间的相互作用关系进行预测,提高对致病机理方面的研究效率。
附图说明
[0026]图1为本专利技术的流程示意图;
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]请参阅图1,本专利技术提供一种技术方案:一种蛋白质三维构型数据储存方法,包括如下步骤:
[0029]所述数据储存方法应用在本地储存数据库中,所述本地储存数据库与蛋白在线数
据库之间建立数据下载通道;
[0030]通过所述数据下载通道,从所述蛋白在线数据库中获取与请求数据相匹配的文件;
[0031]将所述文件加载至预设储存位置。
[0032]进一步的,建立与所述文件长度相同的数据表S(i,j),所述数据表S包括行地址i和列地址j,所述行地址i代表储存数据,所述列地址j代表数据信息名称。
[0033]进一步的,将所述文件数据依次储存至数据表S中;
[0034]其中:
[0035]所述数据表S第一行S(i,0)用于储存蛋白质的氨基酸序列,所述序列通过氨基酸缩写进行储存
[0036]所述数据表S第二行S(i,1)至第四行(i,3)依次储存相应氨基酸的空间坐标(x,y,z),
[0037]所述数据表S第五行S(i,4)至第九行S(i,8)用于储存蛋白指纹。
[0038]进一步的,所述蛋白指纹是将蛋白质以12个氨基酸长度为一个单位进行分割,使蛋白形成相应的氨基酸区间,并以[1,k]依次储存,其中k=(氨基酸长度/12)+1。
[0039]进一步的,所述蛋白指纹数据包括形状指数,泊松

玻尔兹曼静电数值,氢键电位,疏水性以及测地坐标系。
[0040]进一步的,所述形状指数描述了表面上每个氨基酸周围的形状,其数值范围从

1(高度凹)到+1(高度凸);
[0041]所述形状指数定义为:
[0042]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种蛋白质三维构型数据储存方法,其特征在于:包括如下步骤:所述数据储存方法应用在本地储存数据库中,所述本地储存数据库与蛋白在线数据库之间建立数据下载通道;通过所述数据下载通道,从所述蛋白在线数据库中获取与请求数据相匹配的文件;将所述文件加载至预设储存位置。2.根据权利要求1所述的一种蛋白质三维构型数据储存方法,其特征在于:建立与所述文件长度相同的数据表S(i,j),所述数据表S包括行地址i和列地址j,所述行地址i代表储存数据,所述列地址j代表数据信息名称。3.根据权利要求2所述的一种蛋白质三维构型数据储存方法,其特征在于:将所述文件数据依次储存至数据表S中;其中:所述数据表S第一行S(i,0)用于储存蛋白质的氨基酸序列,所述序列通过氨基酸缩写进行储存所述数据表S第二行S(i,1)至第四行(i,3)依次储存相应氨基酸的空间坐标(x,y,z),所述数据表S第五行S(i,4)至第九行S(i,8)用于储存蛋白指纹。4.根据权利要求3所述的一种蛋白质三维构型数据储存方法,其特征在于:所述蛋白指纹是将蛋白质以12个氨基酸长度为一个单位进行分割,使蛋白形成相应的氨基酸区间,并以[1,k]依次储存,其中k=(氨基酸长度/12)+1。5.根据权利要求3所述的一种蛋白质三维构型数据储存方法...

【专利技术属性】
技术研发人员:黄劼徐金亮陈昱希
申请(专利权)人:中科南京生命健康高等研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1