当前位置: 首页 > 专利查询>河海大学专利>正文

一种基于图形表示的蛋白质数据结构处理方法技术

技术编号:46622448 阅读:1 留言:0更新日期:2025-10-14 21:17
一种基于图形表示的蛋白质数据结构处理方法,属于真实数据处理领域。在蛋白质结构领域,由于蛋白质数据银行(PDB)数据库中的数据具有不一致性和不完整性,本研究创建了一种改进的数据结构命名为GVNN数据集,用于更有效地处理和使用这些数据。GVNN通过重新命名蛋白质、残基和原子,引入了HALFLINKLIST和LINKLIST结构,以图形方式描述蛋白质的三维结构,其中包括原子间的局部坐标、键长和扭转角信息。此外,本文详细介绍了残基匹配算法,保证了数据的一致性和准确性。通过将PDB转换为GVNN数据集,可以更精确地进行蛋白质结构预测,有助于深入理解蛋白质的功能和机理。本研究的方法使蛋白质结构含有更丰富信息,可以使模型更好得提取特征。

【技术实现步骤摘要】

:本专利技术涉及一种基于图形表示的蛋白质数据结构处理方法,属于真实数据处理领域。


技术介绍

0、
技术介绍

1、pdb数据库是一个全球性的信息库,主要用于存储生物大分子的三维结构数据。这些大分子主要包括蛋白质、核酸以及它们的复合物。pdb存储的数据包括但不限于:蛋白质和核酸的三维结构数据,这些数据通常是通过x射线晶体学、核磁共振(nmr)光谱学或冷冻电镜(cryo-em)等技术获得的;与结构相关的生物学功能信息;实验方法、原始数据以及分析结果等相关文献。

2、尽管pdb是蛋白质结构研究中最重要和最广泛使用的数据库之一,但在将其作为数据集用于深度学习或其他生物信息学分析时,会有很多的不便。比如:数据质量的不一致性、缺失和不完整的数据等。其原因是因为pdb中的数据是由世界各地的研究团队贡献的,这些数据是通过不同的实验条件和方法获得的。因此,不同结构的质量可能存在较大差异,如分辨率、误差水平等。这种质量的不一致性可能会对基于这些数据的模型训练和验证产生影响。以及pdb中的某些结构条目可能存在缺失或不完整的情况,如部分残基或原子缺失。这种情本文档来自技高网...

【技术保护点】

1.基于图形表示的蛋白质数据结构处理方法,是用于蛋白质结构预测处理数据集的一种方法。

【技术特征摘要】

1.基于图形表示的蛋白质数据结构处理方法,...

【专利技术属性】
技术研发人员:陈浩东孟朝晖顾涛
申请(专利权)人:河海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1