【技术实现步骤摘要】
:本专利技术涉及一种基于图形表示的蛋白质数据结构处理方法,属于真实数据处理领域。
技术介绍
0、
技术介绍
:
1、pdb数据库是一个全球性的信息库,主要用于存储生物大分子的三维结构数据。这些大分子主要包括蛋白质、核酸以及它们的复合物。pdb存储的数据包括但不限于:蛋白质和核酸的三维结构数据,这些数据通常是通过x射线晶体学、核磁共振(nmr)光谱学或冷冻电镜(cryo-em)等技术获得的;与结构相关的生物学功能信息;实验方法、原始数据以及分析结果等相关文献。
2、尽管pdb是蛋白质结构研究中最重要和最广泛使用的数据库之一,但在将其作为数据集用于深度学习或其他生物信息学分析时,会有很多的不便。比如:数据质量的不一致性、缺失和不完整的数据等。其原因是因为pdb中的数据是由世界各地的研究团队贡献的,这些数据是通过不同的实验条件和方法获得的。因此,不同结构的质量可能存在较大差异,如分辨率、误差水平等。这种质量的不一致性可能会对基于这些数据的模型训练和验证产生影响。以及pdb中的某些结构条目可能存在缺失或不完整的情况,如部分残
...【技术保护点】
1.基于图形表示的蛋白质数据结构处理方法,是用于蛋白质结构预测处理数据集的一种方法。
【技术特征摘要】
1.基于图形表示的蛋白质数据结构处理方法,...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。