The invention discloses a non-invasive prenatal bioinformatics detection system and its method and application. The method comprises the following steps: 1) extracting the peripheral blood cfDNA of pregnant women for whole genome sequencing to obtain the original download data; 2) automatic monitoring program monitoring the original data download, automatically completing the delivery task of the analysis process; 3) self-monitoring program. Actively complete the offline data splitting task, fastq raw data quality control, reference genome alignment and quality control. The method of the invention can automatically complete the whole process from data off-line monitoring to automatic analysis and then to give the test results, without human operation, reduce the error caused by human factors, reduce the complexity of data analysis, and make it more suitable for production.
【技术实现步骤摘要】
一种无创产前生物信息学检测系统及其方法和应用
本专利技术属于生物信息学领域,涉及一种自动分析方法及其应用,尤其涉及一种无创产前生物信息学检测系统及其方法和应用。
技术介绍
目前,高通量测序可以实现一次测序几十到上百个样本,同时产出几百G的数据量,数据量之大,样本之多都对目前的数据分析提出了严峻的考验;此外,高通量数据分析步骤繁多,人为参与较多,容易造成误差,并且不便于投入生产。目前,主流的无创产前检测流程(NIPT)主要采用了标准Z值算法和GC矫正Z值算法等,不同的算法对chr13、chr18与chr21的检出效果不同:其中,标准Z值算法对chr21三体检出效果较好,GC矫正Z值算法对chr13与chr18三体检出效果较好。此外,计算胎儿浓度的算法也较多,包括基于Y染色体法、基于SNP方法与基于序列片段(reads)长度方法等。现有技术中,CN201610377564.6公开了一种无创产前生物信息检测分析方法,采用稳健回归和CV回归,根据不同的待测样本数量选择不同的检测分析方法,利用待测样本所获得的参数和正常参考集所获得的参数采取不同的分析策略,更大程度上提升分析的准确度。CN200710028600.9保护了一种检测21号染色体和性染色体数目异常的试剂盒,该试剂盒利用定量荧光多重聚合酶链反应技术,分别以21-三体和性染色体上特异的遗传位点进行荧光引物七重复合扩增,根据扩增产物剂量的差异分析染色体数目异常,达到检测临床样品中21号染色体和性染色体数目异常的目的。上述不同算法的计算结果略有差异,目前比较权威的计算方法是基于chrY染色体法,但是此方法只能计算 ...
【技术保护点】
1.一种无创产前生物信息学检测方法,其特征在于,所述方法包括以下步骤:(1)获取原始数据:提取孕妇外周血cfDNA,进行全基因组测序,得到原始数据;(2)原始数据的筛选投递:启动自动监控程序,判断原始数据是否完全完成测序流程并获得原始数据,以及样本配置文件是否准备完毕,如果结果为“是”,进入步骤(3);如果结果为“否”,返回步骤(1),直到自动监控程序的结果为“是”为止,进入步骤(3);(3)原始数据质控:对结果为“是”的原始数据进行数据拆分,得到fastq文件,然后对fastq文件进行基本质控;对于不满足质控要求的数据,不进行后续的分析工作,重新测序;满足质控要求的数据则进行参考基因比对和结果输出。
【技术特征摘要】
1.一种无创产前生物信息学检测方法,其特征在于,所述方法包括以下步骤:(1)获取原始数据:提取孕妇外周血cfDNA,进行全基因组测序,得到原始数据;(2)原始数据的筛选投递:启动自动监控程序,判断原始数据是否完全完成测序流程并获得原始数据,以及样本配置文件是否准备完毕,如果结果为“是”,进入步骤(3);如果结果为“否”,返回步骤(1),直到自动监控程序的结果为“是”为止,进入步骤(3);(3)原始数据质控:对结果为“是”的原始数据进行数据拆分,得到fastq文件,然后对fastq文件进行基本质控;对于不满足质控要求的数据,不进行后续的分析工作,重新测序;满足质控要求的数据则进行参考基因比对和结果输出。2.根据权利要求1所述的无创产前生物信息学检测方法,其特征在于,所述参考基因比对具体包括:通过与参考基因组比对,进行胎儿第13、18和21号染色体的胎儿染色体异常检测,以及胎儿浓度检测;优选地,所示结果输出具体包括:根据步骤(3)和步骤(4),分别根据胎儿染色体异常检测的判断标准和胎儿浓度检测的判断标准,输出最终结果。3.根据权利要求1或2所述的无创产前生物信息学检测方法,其特征在于,在步骤(1)中,采用二代测序仪进行全基因组测序;优选地,采用nextseq500测序仪进行全基因组测序;优选地,所述全基因组测序的测序序列片段的长度为30-300bp,优选为50-125bp;优选地,所述全基因组测序采用单端测序和/或双端测序,优选为单端测序。4.根据权利要求1-3中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(2)中,通过监控“RunCompletionStatus.xml”文件是否生成,判断原始数据是否完全完成测序流程并获得原始数据。5.根据权利要求1-4中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(3)中,采用bcl2fastq软件对结果为“是”的原始数据进行数据拆分,得到fastq文件;优选地,采用Fastqc软件对所述fastq文件进行基本质控。6.根据权利要求2所述的无创产前生物信息学检测方法,其特征在于,在步骤(4)中,采用短序列比对软件与参考基因组进行比对;优选地,所述参考基因组为人类基因组,优选为hg19基因组;优选地,与参考基因组进行比对所得结果以sam文件或bam文件的形式输出,优选为sam文件。优选地,所述胎儿染色体异常检测采用标准Z值法进行,然后采用GC矫正Z值法进行胎儿染色体异常检测;再采用开源的软件Wisecondor对上述比对结果进行统计,得到结果;优选地,所述标准Z值法采用批次内阴性样本作为参考;优选地,所述标准Z值法的计算公式为:优选地,所述胎儿浓度检测计算公式为:检测样本Y染色体含量=(成年男性Y染色体含量*胎儿DNA含量)+怀女胎儿妇女Y染色体含量*(1-胎儿DNA含量)通过公式变化,胎儿DNA含量计算如下:采用开源的SeqFF算法计算胎儿浓度,最后分析流程得到两种计算方法得到的平均值,作为最终结果。7.根据权利要求2或6中任一项所述的无创产前生物信息学检测方法,其特征在于,在步骤(5)中,所述胎儿染色体异常检测的判断标准为:若|Z值|≤3,则胎儿染色体为正常;若Z值>3,则胎儿染色体为三倍体;若Z值<-3,则胎儿染色体为单倍体;优选地,所述胎儿浓度检测的判断标准为:若胎儿浓度≥...
【专利技术属性】
技术研发人员:冯冬,申童,王玲,柴座林,
申请(专利权)人:北京乐普基因科技股份有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。