基于基因数据的基因体检系统技术方案

技术编号:24414397 阅读:36 留言:0更新日期:2020-06-06 10:45
本发明专利技术涉及基因体检技术领域,且公开了基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,数据库由SNP位点分型数据库和分型结果个性化解读数据库构成。该基于基因数据的基因体检系统,建立了针对国人的SNP位点分型数据库和分型结果个性化解读数据库,将分析结果直接关联到性状疾病等的解读,使结论更具针对性,同时提高操作效率,且现有基因测序下机数据的分析中使用多种软件,操作过程繁琐耗时,本基于基因数据的基因体检系统,通过建立SNP位点分型数据库和分型结果个性化解读数据库,可直接将测序后的基因数据与数据库数据比对,做到一键式分析,节省时间人力成本,提高操作效率。

Gene physical examination system based on gene data

【技术实现步骤摘要】
基于基因数据的基因体检系统
本专利技术涉及基因体检
,具体为基于基因数据的基因体检系统。
技术介绍
基因是携带遗传信息的DNA片段,目前已知的人类基因组共有2-3万个基因,由DNA上30亿对碱基构成,基因通过复制把遗传信息传递给下一代,从而控制生物个体的性状;基因体检的基础是基因测序技术的飞速发展和科学家对基因研究的日益深入,上世纪九十年代,人类启动了“人类基因组计划”,利用荧光标记碱基后捕捉荧光信号,从而获得基因碱基序列信息,测序技术从第一代到如今的第三代第四代测序技术,发展经历了三十多年,测序通量、准确率大幅提高,耗时、成本大幅降低,根据使用场景,基因检测分为科研及、临川及和消费级,随着基因检测由单独用于科研发展到临床级别和消费级别,市场对基因数据的高效准确处理的要求也越来越高;消费级基因体检在美国起步较早,10年前美国已出现了面向大众的消费级基因体检产品,2013年前后,消费级基因体检登陆我国,并迅速发展,据统计目前国内的消费级基因体检公司已超过200家,随着用户量和基因数的积累,数据可用于药物研发、健康险设计等,也有助于推动国人基因组学研究的发展,推动精准医疗;消费级基因检测流程包括样本收集、基因测序、基因数据分析、遗传信息解读和健康报告出具,针对不同的测序方法,基因数据的分析方法也不尽相同,大致流程都包括数据质量评估、参考序列比对、SNP检测注释等步骤,获得SNP数据后,需要通过位点数据库将其与疾病、个体特征、用药情况等关联起来,解读成为消费者可理解内容,并个性化给出生活方式上的指导建议。然而,一般的消费级基因检测流程,是通过样品采集——基因测序——数据分析——信息解读——出具报告,其中基因数据分析、遗传信息解读和出具报告过程繁琐耗时,从而不仅降低了基因体检的效率,且同时容易在操作过程中出现操作失误。
技术实现思路
本专利技术提供了基于基因数据的基因体检系统,具备提高基因体检效率、降低人工成本和操作失误的优点,解决了一般的消费级基因检测流程,是通过样品采集——基因测序——数据分析——信息解读——出具报告,其中基因数据分析、遗传信息解读和出具报告过程繁琐耗时,从而不仅降低了基因体检的效率,且同时容易在操作过程中出现操作失误的问题。本专利技术提供如下技术方案:基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,所述数据库由SNP位点分型数据库和分型结果个性化解读数据库构成。基于基因数据的基因体检系统的数据库建立方法,包括以下步骤:S1、通过样本采集对基因数据进行采集;S2、利用基因测序对步骤1中采集的基因数据进行测序;S3、通过数据分析对步骤2测序的基因数据进行质量评估(5)、序列比对和SNP检测,从而将原始序列信息转化为与疾病、性状等相关的位点信息,即获得SNP位点数据;S4、通过步骤3中获得的SNP位点数据建立SNP位点分型数据库,并根据SNP位点数据所计算出的患病风险建立出相关的分型结果个性化解读数据库。精选的,所述序列比对是对待分析的序列和标准的序列进行比对。精选的,所述质量评估、序列比对和SNP检测三个检测过程中需要使用到大量生物信息分析软件进行分析,如fastqc、SOAPnuke、fastp、BWA、samtools、GATK、Annovar等,逐个操作这些生物信息软件,最后得到SNP位点数据。精选的,所述SNP位点分型数据库由大量GWAS(全基因组关联性研究)论文进行扩充,针对某一疾病的某个位点进行大量信息挖掘,找出了位点与疾病的相关性,同时结合多个位点,使用相应算法,计算出多个位点与同一疾病的相关性。精选的,所述分型结果个性化解读数据库是针对SNP位点数据计算出的患病风险,给出相关衣食住行用药等多方面个性化指导方案的数据库,该数据库的建立一方面参考了大量论文,另一方面也结合了资深营养师、遗传咨询师、药剂师等的专业意见,保证了结果的准确性和可读性。基于基因数据的基因体检系统的体检报告自动化生成系统,包括以下步骤:S1、通过样本采集对基因数据进行采集;S2、利用基因测序对步骤1中采集的基因数据进行测序;S3、将步骤2中测序获得的基因数据输入到SNP位点分型数据库中,与SNP位点分型数据库中所储存的基因数据进行比对并利用分型结果个性化解读数据库给出合理化的建议,并生成PDF或者H5格式的健康管理报告,方便消费者的阅读。本专利技术具备以下有益效果:1、该基于基因数据的基因体检系统,通过采集基因体检过程中产生的SNP站点数据信息配合大量论文,进行深度数据挖掘,建立了针对国人的SNP位点分型数据库和分型结果个性化解读数据库,做到了将分析结果直接关联到性状疾病等的解读,使结论更具针对性,同时提高操作效率,且现有技术在基因测序下机数据的分析中使用多种软件,每个软件都需要单独操作,过程繁琐耗时,本基于基因数据的基因体检系统,通过建立SNP位点分型数据库和分型结果个性化解读数据库,可直接将测序后的基因数据与数据库数据比对,做到一键式分析,节省时间人力成本,提高操作效率。2、该基于基因数据的基因体检系统,通过将基因体检系统化和流程化,通过不同参数的选择,一键式可视化生成基因健康管理报告,可避免操作人员在分步操作中可能出现的操作失误。附图说明图1为本专利技术数据库建立流程图;图2为本专利技术体检报告自动化生成流程图。图中:1、样本采集;2、基因测序;3、数据分析;4、序列比对;5、质量评估;6、SNP检测;7、SNP位点分型数据库;8、分型结果个性化解读数据库。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。请参阅图1-2,基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,数据库由SNP位点分型数据库7和分型结果个性化解读数据库8构成;数据库中的SNP位点分型数据库7由对基因数据进行采集的样本采集1、对采集的基因数据进行测序的基因测序2、对测序的基因数据进行分析的数据分析3、由SNP位点数据并由大量GWAS论文进行扩充后建立的SNP位点分型数据库7和由SNP位点数据所计算出的患病风险、参考大量论文,并结合资深营养师、遗传咨询师、药剂师等的专业意见建立出相关的分型结果个性化解读数据库8构成,SNP位点分型数据库7由大量GWAS全基因组关联性研究论文进行扩充,针对某一疾病的某个位点进行大量信息挖掘,找出了位点与疾病的相关性,同时结合多个位点,使用相应算法,计算出多个位点与同一疾病的相关性,分型结果个性化解读数据库8是针对SNP位点数据计算出的患病风险,给出相关衣食住行用药等多方面个性化指导方案的数据库,该数据库的建立一方面参考了大量论文,另一方面也结合了资深营养本文档来自技高网
...

【技术保护点】
1.基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,其特征在于:所述数据库由SNP位点分型数据库(7)和分型结果个性化解读数据库(8)构成。/n

【技术特征摘要】
1.基于基因数据的基因体检系统,包括数据库和体检报告自动化生成系统,其特征在于:所述数据库由SNP位点分型数据库(7)和分型结果个性化解读数据库(8)构成。


2.基于基因数据的基因体检系统的数据库建立方法,其特征在于,包括以下步骤:
S1、通过样本采集(1)对基因数据进行采集;
S2、利用基因测序(2)对步骤1中采集的基因数据进行测序;
S3、通过数据分析(3)对步骤2测序的基因数据进行质量评估(5)、序列比对(4)和SNP检测(6),从而将原始序列信息转化为与疾病、性状等相关的位点信息,即获得SNP位点数据;
S4、通过步骤3中获得的SNP位点数据建立SNP位点分型数据库(7),并根据SNP位点数据所计算出的患病风险建立出相关的分型结果个性化解读数据库(8)。


3.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述序列比对(4)是对待分析的序列和标准的序列进行比对。


4.根据权利要求2所述的基于基因数据的基因体检系统的数据库建立方法,其特征在于:所述质量评估(5)、序列比对(4)和SNP检测(6)三个检测过程中需要使用到大量生物信息分析软件进行分析,如fastqc、SOAPnuke、fastp、BWA、samtools、GATK、Annovar等,...

【专利技术属性】
技术研发人员:罗奇斌申玉林廖胜光任毅
申请(专利权)人:北京奇云诺德信息科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1