一种无创产前生物信息学检测系统及其方法和应用技术方案

技术编号:18658440 阅读:25 留言:0更新日期:2018-08-11 14:37
本发明专利技术公开了一种无创产前生物信息学检测系统及其方法和应用,所述方法包括以下步骤:1)提取孕妇外周血cfDNA进行全基因组测序,得到原始的下机数据;2)自动监控程序监控原始数据下机,自动完成分析流程的投递任务;3)自动完成下机数据拆分任务,fastq原始数据质控,参考基因组比对与质控。本发明专利技术的方法能自动完成从数据下机监控到自动分析再到给出检测结果的整个过程,中间无需人员进行操作,减少人为因素引入的误差,减少数据分析的复杂性,使其更适合投入生产使用。

Noninvasive prenatal bioinformatics detection system, method and application thereof

The invention discloses a non-invasive prenatal bioinformatics detection system and its method and application. The method comprises the following steps: 1) extracting the peripheral blood cfDNA of pregnant women for whole genome sequencing to obtain the original download data; 2) automatic monitoring program monitoring the original data download, automatically completing the delivery task of the analysis process; 3) self-monitoring program. Actively complete the offline data splitting task, fastq raw data quality control, reference genome alignment and quality control. The method of the invention can automatically complete the whole process from data off-line monitoring to automatic analysis and then to give the test results, without human operation, reduce the error caused by human factors, reduce the complexity of data analysis, and make it more suitable for production.

【技术实现步骤摘要】
一种无创产前生物信息学检测系统及其方法和应用
本专利技术属于生物信息学领域,涉及一种自动分析方法及其应用,尤其涉及一种无创产前生物信息学检测系统及其方法和应用。
技术介绍
目前,高通量测序可以实现一次测序几十到上百个样本,同时产出几百G的数据量,数据量之大,样本之多都对目前的数据分析提出了严峻的考验;此外,高通量数据分析步骤繁多,人为参与较多,容易造成误差,并且不便于投入生产。目前,主流的无创产前检测流程(NIPT)主要采用了标准Z值算法和GC矫正Z值算法等,不同的算法对chr13、chr18与chr21的检出效果不同:其中,标准Z值算法对chr21三体检出效果较好,GC矫正Z值算法对chr13与chr18三体检出效果较好。此外,计算胎儿浓度的算法也较多,包括基于Y染色体法、基于SNP方法与基于序列片段(reads)长度方法等。现有技术中,CN201610377564.6公开了一种无创产前生物信息检测分析方法,采用稳健回归和CV回归,根据不同的待测样本数量选择不同的检测分析方法,利用待测样本所获得的参数和正常参考集所获得的参数采取不同的分析策略,更大程度上提升分析的准确度。CN200710028600.9保护了一种检测21号染色体和性染色体数目异常的试剂盒,该试剂盒利用定量荧光多重聚合酶链反应技术,分别以21-三体和性染色体上特异的遗传位点进行荧光引物七重复合扩增,根据扩增产物剂量的差异分析染色体数目异常,达到检测临床样品中21号染色体和性染色体数目异常的目的。上述不同算法的计算结果略有差异,目前比较权威的计算方法是基于chrY染色体法,但是此方法只能计算怀男胎儿的胎儿浓度,而无法计算女胎儿的胎儿浓度。因此,重新开发一种准确度高、能够检测所有胎儿生物信息学的方法显得尤为重要。
技术实现思路
针对上述问题,本专利技术提供一种无创产前生物信息学检测系统及其方法和应用,可以自动完成从数据完成测序流程并获得原始数据(以下简称“下机”)情况的监控到自动分析再到给出检测结果的整个过程,中间无需人员进行操作,减少人为因素引入的误差,降低假阴性假阳性的检出率,减少数据分析的复杂性,使其更适合投入生产使用。第一方面,本专利技术提供一种无创产前生物信息学检测方法,所述方法包括以下步骤:(1)获取原始数据:提取孕妇外周血cfDNA,进行全基因组测序,得到原始数据;(2)原始数据的筛选投递:启动自动监控程序,判断原始数据是否完全下机以及样本配置文件是否准备完毕,如果结果为“是”,进入步骤(3);如果结果为“否”,返回步骤(1),直到自动监控程序的结果为“是”为止,进入步骤(3);(3)原始数据质控:对结果为“是”的原始数据进行数据拆分,得到fastq文件,然后对fastq文件进行基本质控;对于不满足质控要求的数据,不进行后续的分析工作,重新测序;满足质控要求的数据则进行参考基因比对和结果输出。优选地,所述参考基因比对具体包括:通过与参考基因组比对,进行胎儿第13、18和21号染色体的胎儿染色体异常检测,以及胎儿浓度检测。优选地,所示结果输出具体包括:根据步骤(3)和步骤(4),分别根据胎儿染色体异常检测的判断标准和胎儿浓度检测的判断标准,输出最终结果。本专利技术的方法能自动完成从数据下机监控到自动分析再到给出检测结果的整个过程,中间无需人员进行操作,减少人为因素引入的误差,减少数据分析的复杂性,使其更适合投入生产使用。优选地,在步骤(1)中,采用二代测序仪进行全基因组测序。优选地,采用nextseq500测序仪进行全基因组测序。优选地,所述全基因组测序的测序序列片段的长度为30-300bp,例如可以是30bp、40bp、50bp、60bp、70bp、80bp、90bp、100bp、110bp、120bp、130bp、140bp、150bp、160bp、170bp、180bp、190bp、200bp、210bp、220bp、230bp、240bp、250bp、260bp、270bp、280bp、290bp或300bp,以及所述范围内所有的点值,由于篇幅的限制,在此不再一一列举,优选为50-125bp。优选地,所述全基因组测序采用单端测序和/或双端测序,例如可以采用单端测序,或双端测序,或单双端测序的组合,优选为单端测序。优选地,在步骤(2)中,通过监控“RunCompletionStatus.xml”文件是否生成,判断原始数据是否完全下机,由于不同测序平台下机文件的顺序可能不一样,具体监控哪个文件还应根据平台来定。作为优选的方案,可采用perl语言完成监控脚本(Monitor_nipt.pl)编写;采用自编脚本监控原始测序数据是否完全下机和用于分数据的samplesheet文件是否就位;根据数据下机情况自动完成数据的监控与投递任务,此监控系统可以完成循环监控任务,只需投递一次,就可以监控以后所有下机数据,中间无需人员参与,减少了错误的引入。优选地,在步骤(3)中,采用bcl2fastq软件(由Illumina公司官方提供)对结果为“是”的原始数据进行数据拆分,得到fastq文件。优选地,采用Fastqc软件对所述fastq文件进行基本质控(Q20、Q30、数据量等),对不满足质控要求的样本不进行随后的分析工作,重新建库上机测序。优选地,在步骤(4)中,采用短序列比对软件与参考基因组进行比对,例如可采用bowtie2软件。优选地,所述参考基因组为为人类基因组,优选为hg19基因组。优选地,与参考基因组进行比对所得结果以sam文件或bam文件的形式输出,优选为sam文件。优选地,在步骤(4)中,所述胎儿染色体异常检测采用标准Z值法进行,优选采用Python或perl语言实现;然后采用GC矫正Z值法进行胎儿染色体异常检测,优选采用perl语言或R语言实现,获得GC矫正后的样本Z值作为后续的分析使用;随后,采用开源的软件Wisecondor对上述比对结果进行统计,得到结果Wisecondor软件主要以图的形式展示检测结果,在本专利技术修改了其原始代码,使其输出相应染色体的检测Z值;在本专利技术中,优选采用标准Z值法、GC矫正Z值法与wisecondor等多种算法与软件结合的形式进行染色体异常检测,综合判断,以减少假阴性假阳性检率。优选地,所述标准Z值法采用批次内阴性样本(即原始数据中的无染色体异常的胎儿样本)作为参考;通过计算批内阴性样本的平均值与标准差,带入Z值公式来计算所有检测样本的Z值,而并不是现有技术普遍采用的阴性样本集方法;批次内阴性样本作为参考的优点是可以有效减少实验批次间误差,降低假阴性假阳性的检出率。优选地,所述标准Z值法的计算公式为:优选地,在步骤(4)中,所述胎儿浓度检测计算公式为:通过公式变化,可以的胎儿DNA含量计算如下:采用开源的SeqFF算法计算胎儿浓度。由于目前上述两种胎儿浓度检测方法中,每种计算胎儿浓度的方法都有其缺点和局限性,为了进一步降低每个算法的误差,提高检测准确性,在本专利技术中采用两种不同计算方法的平均值来作为最终胎儿浓度。优选地,在步骤(5)中,所述胎儿染色体异常检测的判断标准为:若|Z值|≤3,则胎儿染色体为正常;此时Z值可以是1、2、3、0、-1、-2或-3,以及所述范围内所有的点值,由于篇幅的限制,在此本文档来自技高网
...

【技术保护点】
1.一种无创产前生物信息学检测方法,其特征在于,所述方法包括以下步骤:(1)获取原始数据:提取孕妇外周血cfDNA,进行全基因组测序,得到原始数据;(2)原始数据的筛选投递:启动自动监控程序,判断原始数据是否完全完成测序流程并获得原始数据,以及样本配置文件是否准备完毕,如果结果为“是”,进入步骤(3);如果结果为“否”,返回步骤(1),直到自动监控程序的结果为“是”为止,进入步骤(3);(3)原始数据质控:对结果为“是”的原始数据进行数据拆分,得到fastq文件,然后对fastq文件进行基本质控;对于不满足质控要求的数据,不进行后续的分析工作,重新测序;满足质控要求的数据则进行参考基因比对和结果输出。

【技术特征摘要】
1.一种无创产前生物信息学检测方法,其特征在于,所述方法包括以下步骤:(1)获取原始数据:提取孕妇外周血cfDNA,进行全基因组测序,得到原始数据;(2)原始数据的筛选投递:启动自动监控程序,判断原始数据是否完全完成测序流程并获得原始数据,以及样本配置文件是否准备完毕,如果结果为“是”,进入步骤(3);如果结果为“否”,返回步骤(1),直到自动监控程序的结果为“是”为止,进入步骤(3);(3)原始数据质控:对结果为“是”的原始数据进行数据拆分,得到fastq文件,然后对fastq文件进行基本质控;对于不满足质控要求的数据,不进行后续的分析工作,重新测序;满足质控要求的数据则进行参考基因比对和结果输出。2.根据权利要求1所述的无创产前生物信息学检测方法,其特征在于,所述参考基因比对具体包括:通过与参考基因组比对,进行胎儿第13、18和21号染色体的胎儿染色体异常检测,以及胎儿浓度检测;优选地,所示结果输出具体包括:根据步骤(3)和步骤(4),分别根据胎儿染色体异常检测的判断标准和胎儿浓度检测的判断标准,输出最终结果。3.根据权利要求1或2所述的无创产前生物信息学检测方法,其特征在于,在步骤(1)中,采用二代测序仪进行全基因组测序;优选地,采用nextseq500测序仪进行全基因组测序;优选地,所述全基因组测序的测序序列片段的长度为30-300bp,优选为50-125bp;优选地,所述全基因组测序采用单端测序和/或双端测序,优选为单端测序。4.根据权利要求1-3中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(2)中,通过监控“RunCompletionStatus.xml”文件是否生成,判断原始数据是否完全完成测序流程并获得原始数据。5.根据权利要求1-4中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(3)中,采用bcl2fastq软件对结果为“是”的原始数据进行数据拆分,得到fastq文件;优选地,采用Fastqc软件对所述fastq文件进行基本质控。6.根据权利要求2所述的无创产前生物信息学检测方法,其特征在于,在步骤(4)中,采用短序列比对软件与参考基因组进行比对;优选地,所述参考基因组为人类基因组,优选为hg19基因组;优选地,与参考基因组进行比对所得结果以sam文件或bam文件的形式输出,优选为sam文件。优选地,所述胎儿染色体异常检测采用标准Z值法进行,然后采用GC矫正Z值法进行胎儿染色体异常检测;再采用开源的软件Wisecondor对上述比对结果进行统计,得到结果;优选地,所述标准Z值法采用批次内阴性样本作为参考;优选地,所述标准Z值法的计算公式为:优选地,所述胎儿浓度检测计算公式为:检测样本Y染色体含量=(成年男性Y染色体含量*胎儿DNA含量)+怀女胎儿妇女Y染色体含量*(1-胎儿DNA含量)通过公式变化,胎儿DNA含量计算如下:采用开源的SeqFF算法计算胎儿浓度,最后分析流程得到两种计算方法得到的平均值,作为最终结果。7.根据权利要求2或6中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(5)中,所述胎儿染色体异常检测的判断标准为:若|Z值|≤3,则胎儿染色体为正常;若Z值>3,则胎儿染色体为三倍体;若Z值<-3,则胎儿染色体为单倍体;优选地,所述胎儿浓度检测的判断标准为:若胎儿浓度≥...

【专利技术属性】
技术研发人员:冯冬申童王玲柴座林
申请(专利权)人:北京乐普基因科技股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1