基因数据多维度注释的数据管理系统技术方案

技术编号:20799079 阅读:29 留言:0更新日期:2019-04-06 12:46
本发明专利技术涉及一种基因数据多维度注释的数据管理系统,包括实验数据库、临床信息注释模块、实验数据注释模块、数据质控注释模块、分析结果注释模块和随访信息注释模块;临床信息注释模块管理样本临床信息并传送到实验数据注释模块;实验数据注释模块分析处理数据,将数据传送到数据质控注释模块;数据质控注释模块对数据进行全流程质控,分析数据并传送给分析结果注释模块;分析结果注释模块注释数据并传送到实验数据库存储。本发明专利技术使临床信息记录规范化,信息记录更加完整,解决了目前存在的临床信息时间断点问题,能够对数据进行规范管理,为后续研究奠定基础,使分析结果解读具备更充分的意义,对所有数据进行了有效管理。

Data Management System for Multi-Dimensional Annotation of Gene Data

The invention relates to a data management system for multi-dimensional annotation of gene data, including experimental database, clinical information annotation module, experimental data annotation module, data quality control annotation module, analysis result annotation module and follow-up information annotation module; clinical information annotation module manages clinical information of samples and transmits it to experimental data annotation module; experimental data annotation module analysis; Data processing, data transmission to the data quality control annotation module; data quality control annotation module for the whole process of data quality control, analysis of data and transmission to the analysis results annotation module; analysis results annotation module annotation data and transmission to the experimental database storage. The invention standardizes the clinical information record, makes the information record more complete, solves the current problem of the breakpoint of clinical information, can standardize the management of data, lays the foundation for subsequent research, makes the analysis result interpretation more meaningful, and effectively manages all data.

【技术实现步骤摘要】
基因数据多维度注释的数据管理系统
本专利技术属于基因工程
,具体涉及一种基因数据多维度注释的数据管理系统。
技术介绍
随着二代测序技术的成熟和完善,基因测序在肿瘤研究领域得到了广泛应用。肿瘤样本基因测序可分为基因组测序和转录组测序两大类,基因组测序从基础DNA出发,基于参考基因组寻找出基因突变,从而进一步研究突变对肿瘤的作用和影响。而转录组测序则是从RNA出发,从基因表达层面出发,研究异常表达的基因,从而进一步研究异常表达基因与肿瘤之间的联系。虽然研究出发点不一样,但目的却殊途同归,都是寻找与肿瘤相关的基因突变,研究肿瘤发生机制。无论是基因组测序还是转录组测序,目前的主要流程是实验室负责实验,分析部门只管分析数据,对于数据的质控并不完善。对于样本临床信息和实验流程同样了解不多,所分析出的结果仅仅是基于测序数据的结果,没有很好地与临床信息结合起来。此外,临床信息基本是依靠医生手动整理,由于医生习惯不同、工作不同等差异,导致不同医生整理的信息并不相同,分析人员难以从中获得准确有效的临床信息来对分析结果进行解读。目前对基因测序数据分析,分析人员基本是进行纯数据分析,较少结合数据样本对应的临床信息,导致分析结果实际意义不大。此外,样本临床信息难以主动获取,基本都是依赖于医生个人收集整理。这一过程具备极大的自主性和不确定性。由于各种各样的因素,医生整理的临床信息各不相同,多数时候内容不够条理化,也不够完整,无法提供分析人员所需的全部临床信息。此外,医生提供的临床信息也仅仅局限于获取样本之前的临床信息,对于之后患者的临床表现,并未实时反馈给分析人员,导致信息存在时间断点,完整性不足。
技术实现思路
针对上述现有技术中存在的问题,本专利技术的目的在于提供一种可避免出现上述技术缺陷的基因数据多维度注释的数据管理系统。为了实现上述专利技术目的,本专利技术提供的技术方案如下:一种基因数据多维度注释的数据管理系统,包括实验数据库、临床信息注释模块、实验数据注释模块、数据质控注释模块、分析结果注释模块和随访信息注释模块;临床信息注释模块用于样本临床信息管理,收集、分析样本临床信息并将分析后的数据传送到实验数据注释模块;实验数据注释模块用于分析处理临床信息注释模块传送来的数据,将分析处理后的数据传送到数据质控注释模块,并将分析处理后的数据传送到实验数据库存储;数据质控注释模块用于对数据进行全流程质控,分析实验数据注释模块传送来的数据并将分析后的数据传送给分析结果注释模块,并将分析后的数据传送到实验数据库中进行存储;分析结果注释模块用于对数据质控注释模块传送来的数据进行解读与注释,并将注释后的数据传送到实验数据库存储起来;随访信息注释模块用于将随访数据存储进实验数据库中,对实验数据库中的数据进行更新;实验数据注释模块、数据质控注释模块和分析结果注释模块均能够访问实验数据库并从实验数据库中调取数据。一种基因数据多维度注释的数据管理方法,通过所述基因数据多维度注释的数据管理系统来实现,对基因序列数据进行注释,包括:步骤A)通过临床信息注释模块来实现样本临床信息管理;步骤B)通过实验数据注释模块和实验数据库来实现实验数据管理;步骤C)通过数据质控注释模块来实现测序数据全流程质控;步骤D)通过分析结果注释模块来实现分析结果解读与注释。进一步地,所述数据管理方法还包括:步骤E)通过随访信息注释模块来实现随访数据的更新。进一步地,在步骤A)中,采用样本临床信息收集模板收集管理样本临床信息,收集管理样本临床信息包括:样本编号、肿瘤类型、样本来源、送检人、样本量、样本采集日期、取样位置、取样方式、样本存放位置、检测项目、样本类型。进一步地,在步骤A)中,检测项目涵盖基因组学分析、转录组学分析和正常人疾病风险检测,其中基因组学分析包括全基因组测序、全外显子测序和靶向区域测序,检测内容覆盖碱基替换突变、插入缺失突变、拷贝数变异以及结构变异;转录组学分为基因融合、可变剪切以及差异表达分析,数据覆盖mRNA、microRNA、lncRNA转录测序数据。进一步地,在步骤B)中,实验数据注释模块详细记录并将整个实验流程数据存储到实验数据库中,实验数据库存储的记录信息包括实验室ID、样本接收日期、实验进度、样本取样体积、引物ID、DNA产量、建库产量、杂交捕获产量、上机量、样本存放位置、操作人、实验结果、备注。进一步地,在步骤C)中,从接收到原始数据开始,到原始数据预处理、与参考基因组比对、产生变异分析结果四个环节,数据质控注释模块全都对其进行相应的质控,搭建出一套完整的质控流程。进一步地,在步骤C)中,每个环节的质控结果分为图表和数据文件两大类;数据文件保存在实验数据库中永久留存;图表化结果通过可视化页面进行展示,用表格、图形来展示质控结果。进一步地,在步骤D)中,分析结果注释模块基于原始测序数据进行深入分析,从中挖掘出有用的数据结果。进一步地,在步骤D)中,分析结果注释模块对临床样本进行基因信息、变异有害性、相关靶向药物治疗、化疗的信息注释。本专利技术提供的基因数据多维度注释的数据管理系统,使临床信息记录规范化,信息记录更加完整,具备了临床信息录入管理、样本实验数据存储和管理、分析流程质控结果管理、分析结果多维度注释与解读、患者后续跟踪随访信息管理等功能,不仅解决了目前存在的临床信息时间断点问题,还能够对数据进行规范管理,为后续研究奠定基础,解决了现有技术中的临床信息不规范、不完善、临床信息模板不完善、样本实验与分析环节分离、患者信息随访记录缺少等问题,为分析人员提供所需临床信息,使分析结果解读具备更充分的意义,真正达到生物医学研究的目的,同时对所有数据进行了有效管理,可以很好地满足实际应用的需要。附图说明图1为本专利技术的基因数据多维度注释的数据管理系统的结构框图;图2为样本临床信息收集模板界面图;图3为实验数据库信息输入界面图;图4为数据质控流程图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,下面结合附图和具体实施例对本专利技术做进一步说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。如图1所示,基因数据多维度注释的数据管理系统,包括实验数据库和五个功能模块:临床信息注释模块、实验数据注释模块、数据质控注释模块、分析结果注释模块和随访信息注释模块;临床信息注释模块用于样本临床信息管理,收集、分析样本临床信息并将分析后的数据传送到实验数据注释模块;实验数据注释模块用于分析处理临床信息注释模块传送来的数据,并将分析处理后的数据传送到数据质控注释模块,并将分析处理后的数据传送到实验数据库存储;数据质控注释模块用于对数据进行全流程质控,分析实验数据注释模块传送来的数据并将分析后的数据传送给分析结果注释模块,并同时将分析后的数据传送到实验数据库中进行存储;分析结果注释模块用于对数据质控注释模块传送来的数据进行解读与注释,并将注释后的数据传送到实验数据库存储起来;随访信息注释模块用于将随访数据存储进实验数据库中,对实验数据库中的数据进行更新;实验数据注释模块、数据质控注释模块和分析结果注释模块均能够访问实验数据库并从实验本文档来自技高网
...

【技术保护点】
1.一种基因数据多维度注释的数据管理系统,其特征在于,包括实验数据库、临床信息注释模块、实验数据注释模块、数据质控注释模块、分析结果注释模块和随访信息注释模块。

【技术特征摘要】
1.一种基因数据多维度注释的数据管理系统,其特征在于,包括实验数据库、临床信息注释模块、实验数据注释模块、数据质控注释模块、分析结果注释模块和随访信息注释模块。2.根据权利要求1所述的数据系统,其特征在于,临床信息注释模块用于样本临床信息管理,收集、分析样本临床信息并将分析后的数据传送到实验数据注释模块;实验数据注释模块用于分析处理临床信息注释模块传送来的数据,将分析处理后的数据传送到数据质控注释模块,并将分析处理后的数据传送到实验数据库存储;数据质控注释模块用于对数据进行全流程质控,分析实验数据注释模块传送来的数据并将分析后的数据传送给分析结果注释模块,并将分析后的数据传送到实验数据库中进行存储;分析结果注释模块用于对数据质控注释模块传送来的数据进行解读与注释,并将注释后的数据传送到实验数据库存储起来;随访信息注释模块用于将随访数据存储进实验数据库中,对实验数据库中的数据进行更新;实验数据注释模块、数据质控注释模块和分析结果注释模块均能够访问实验数据库并从实验数据库中调取数据。3.一种基因数据多维度注释的数据管理方法,其特征在于,通过权利要求1或2所述的基因数据多维度注释的数据管理系统来实现,对基因序列数据进行注释,包括:步骤A)通过临床信息注释模块来实现样本临床信息管理;步骤B)通过实验数据注释模块和实验数据库来实现实验数据管理;步骤C)通过数据质控注释模块来实现测序数据全流程质控;步骤D)通过分析结果注释模块来实现分析结果解读与注释。4.根据权利要求1-3所述的数据管理方法,其特征在于,所述数据管理方法还包括:步骤E)通过随访信息注释模块来实现随访数据的更新。5.根据权利要求1-4所述的数据管理方法,其特征在于,在步骤A)中,采用样本临床信息收集模板收...

【专利技术属性】
技术研发人员:杨文婷陈亮
申请(专利权)人:江苏医联生物科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1