一种肿瘤新生抗原及靶向药信息的存储方法技术

技术编号:34916891 阅读:31 留言:0更新日期:2022-09-15 07:07
本发明专利技术公开了一种肿瘤新生抗原及靶向药信息的存储方法,包括如下步骤:整理肿瘤新生抗原及靶向药信息的分析过程,理清分析流程中每个步骤产生的关键信息对象,以及它们之间的关联关系,并依据形成的关系网络进行建模;基于建模结果设立节点,并在相互关联的节点间建立代表关系的边,以便后续进行实际数据存储;从待提取信息的数据库,电子表格文件、原始数据文件或数据接口信息来源中抽提出待存储于节点和边上的数据,并它们分别存储于图数据库对应的节点或边中。本发明专利技术能够显著缩小记录信息所需的存储空间,减少信息查询时间,使得回溯信息更为方便,与传统信息存储方法相比,该方法使得数据构架的调整更改更为灵活便捷,能够节省人力物力。够节省人力物力。够节省人力物力。

【技术实现步骤摘要】
一种肿瘤新生抗原及靶向药信息的存储方法


[0001]本专利技术涉及生物信息
,特别是一种基于图数据库的肿瘤新生抗原及靶向药信息的存储方法。

技术介绍

[0002]随着科技的发展,我们已逐步进入针对个人的精准诊疗、个体化诊疗的时代。目前,精准医疗与个体化诊疗开展的基础是个体基因组的测序及分析,而这一过程将产生数量级远超传统诊疗手段的信息及数据。这些互相关联的海量数据不仅带来了信息存储和管理的困难,而且使查询和使用这些数据的难度增加。例如在设计新生抗原疫苗时,需要首先对患者进行测序,然后对测序数据进行分析,检测患者的突变。突变会涉及基因、转录本等信息,不同的突变又会产生不同的抗原表位和新生抗原,不同的抗原表位和人类白细胞抗原(human leukocyte antigen,缩写HLA)分子的亲和力又不同。而不同的患者又具有不同的HLA分型。对于靶向药来说,因不同的靶向药针对的靶点不同,其与患者的基因和突变也存在复杂的多对多的关系。以上数据在使用时均需要进行快速的关联查询。因此在设计数据库架构时就必须充分考虑数据间的关联性、潜在的查询需求及查询本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种肿瘤新生抗原及靶向药信息的存储方法,其特征在于,包括如下步骤:步骤一,整理肿瘤新生抗原及靶向药信息的分析过程,理清分析流程中每个步骤产生的关键信息对象,以及它们之间的关联关系,并依据形成的关系网络进行建模;步骤二,基于建模结果设立节点,并在相互关联的节点间建立代表关系的边,以便后续进行实际数据存储;步骤三,从待提取信息的数据库,电子表格文件、原始数据文件或数据接口信息来源中抽提出待存储于节点和边上的数据,并将这些数据存储于图数据库的节点或边中。2.根据权利要求1所述的一种肿瘤新生抗原及靶向药信息的存储方法,其特征在于,所述的图数据包含FlockDB、Galaxybase、Neo4j、AllegroGrap、GraphDB、InfiniteGraph、HugeGraph、StellarDB中的一种。3.根据权利要求1所述的一种肿瘤新生抗原及靶向药信息的存储方法,其特征在于,步骤二中所述设立的节点包括:分析、突变、基因、转录本、氨基酸改变、野生型长肽、突变型长肽、HLA基因型、野生型表位、突变型表位、新生抗原长肽。4.根据权利要求3所述的一种肿瘤新生抗原及靶向药信息的存储方法,其特征在于,步骤二中所述节点间建立代表关系的边包括:在“分析信息”及“突变”之间设立代表“胚系检出”及“体细胞检出”关系的边;在“突变”与“基因”之间建立代表“属于”关系的边;在“分析信息”和“基因”之间建立代表“包含”关系的边;在“分析信息”和“转录本”之间建立代表“包含”关系的边;在“基因”和“转录本”之间建立代表“包含”关系的边;在“转录本”和“氨基酸改变”之间建立代表“包含”关系的边;在“突变”和“氨基酸改变”之间建立代表“注释”关系的边;在“氨基酸改变”和“野生型长肽”之间建立代表“解析”关系的边;在“氨基酸改变”和“突变型长肽”之间建立代表“解析”关系的边;在“突变型长肽”和“野生型长肽”之间建立代表“配对”关系的边;在“突变型长肽”和“突变型表位”之间建立代表“生成”关系的边;在“野生型长肽”和“野生型表位”之间建立代表“生成”关系的边;在“突变型表位”和“野生型表位”之间建立代表“配对”关系的边;在“分析信息”和“HLA基因型”之间建立代表“基因型鉴定”关系的边;在“HLA基因型”和“突变型表位”之间建立代表“亲和力”关系的边;在“HLA基因型”和“野生型表位”之间建立代表“亲和力”关系的边;在“突变型表位”和“新生抗原长肽”之间建立代表“构成”关系的边。5.根据权利要求4所述的一种肿瘤新生抗原及靶向药信息的存储方法,其特征在于,存储于图数据库的节点或边中的数据包括:各个节点储存的信息如下:分析信息节点中存储:能特征性地代表一次分析过程的信息;突变节点中存储:能代表突变特征的信息;基因节点中存储:能特征性地表示该基因及说明该基因功能的信息;转录本节点中存储:能代表转录本特征的信息;氨基酸改变节点中存储:能够准确解释突变造成的实际影响的信息;突变型长肽节点中存储:包含突变引起的氨基酸改变的长肽氨基酸序列,以及该序列的固有性质信息;野生型长肽节点中存储:与突变型长肽配对的,未经突变引起氨基酸改变的长肽氨基酸序列,以及代表该序列的固有性质信息;
HLA基因型节点中存储:通过各种实验手段鉴定得到的HLA基因型;突变型表位节点中存储:包含突变引起的氨基酸改变的表位氨基酸序列,以及该序列的固有性质信息;野生型表位节点中存储:与突变型表位配对的,未经突变引起氨基酸改变的表位氨基酸序列,以及代表该序列的固有性质信息;新生抗原长肽节点中存储:新生抗原肽的氨基酸序列,以及该序列的固有性质信息。各个代表关系的边中存储的信息见下:在“分析信息”及“突变”之间的代表“胚系检出”及“体细胞检出”关系的边中存储:代表突变在分析中的检出情况信息;在“分析信息”和“基因”之间的代表“包含”关系的边中存储:在代表基因表达量计算情况的信息;在“分析信息”和“转录本”之间的代表“包含”关系的边:代表转录本表达量计算情况的信息;在“突变型长肽”和“突变型表位”之间代表“生成”关系的边中存储:表示表位在长肽氨基酸序列上位置的信息;在“野生型长肽”和“野生型表位”之间代表“生成”关系的边中存储:表示表位在长肽氨基酸序列上位置的信息;在“分析信息”和“HLA基因型”之间代表“基因型鉴定”关系的边中存储:代表分析中HLA基因型鉴定情况的信息;在“HLA基因型”和“突变型表位”之间代表“亲和力”关系的边中存储:能描述特定基因型的HLA...

【专利技术属性】
技术研发人员:莫凡陈相剑邱旻
申请(专利权)人:杭州纽安津生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1