The invention discloses a chromosome abnormality detection device. The existing chromosomal anomaly detection and analysis are based on the reading length counting statistical model, which can only remove the repeat sequences of the same starting position in the genome, and can not remove the reads with different starting positions but overlap each other. The invention can be effectively removed by introducing a sequence coverage (coverage) statistical model. In addition to the repeat sequence and overlapping region of the whole genome amplification of single cell, the homogeneity of data is improved significantly, and the data noise is reduced, the detection rate of positive samples is improved and the false positive rate is reduced.
【技术实现步骤摘要】
一种染色体异常检测装置
本专利技术涉及数据处理技术,具体涉及一种染色体异常检测装置。
技术介绍
近年来,随着接受辅助生殖助孕的患者越来越多,大量临床发现在辅助生殖过程中部分高风险夫妇的胚胎易出现反复种植失败或不明原因自然流产的情况,试管婴儿总体活产率不足30%,而研究发现胚胎染色体异常是导致试管婴儿失败的主要原因。因此,对胚胎进行植入前染色体异常检测,进而选择健康的胚胎进行植入,可显著提高试管婴儿的妊娠率和活产率。胚胎植入前染色体异常检测需要对囊胚期胚胎滋养外胚层细胞或卵裂球进行单细胞扩增,使之达到高通量测序平台所需要的DNA起始量,即由pg级别的DNA达到μg级别的DNA含量;目前主流的单细胞扩增方法按原理分为三类:基于PCR的单细胞扩增方法(如DOP-PCR)[1],多重链置换扩增(MDA)[2]和多次退火环状循环扩增技术(MALBAC)[3]。由于这些单细胞扩增方法都是采用几十轮指数扩增,这使得基因组某些特异性位点的扩增偏好性被无限放大,产生大量重复序列(duplicatereads),导致测序深度的均一性显著降低,最终造成样本结果分析中出现大量异常值及假阳性结果。因此,去除由扩增偏好性带来的重复序列对基于单细胞扩增的胚胎植入前染色体异常检测是非常重要的。目前,针对胚胎的染色体异常检测分析都是基于读长计数(readsnumber):将测序产生的读长(reads)比对到参考基因组中;过滤比对到基因组中相同起始位置的reads(duplicatereads);将参考基因组划分成N个定长的统计窗口,统计每个窗口的读长数;对读长数进行GC校正;对读长数进行归 ...
【技术保护点】
1.一种染色体异常检测装置,包括:测序数据获取单元:用于获取经高通量测序得到的读长片段;比对单元:用于将读长片段与人类基因组参考序列进行比对,获取读长片段的位置信息和长度信息;覆盖度计算单元:用于将人类基因组参考序列划分成若干个第一窗口,根据读长片段的位置信息和长度信息,计算各第一窗口的覆盖度,根据第一窗口的覆盖度和GC含量进行Loess校正;将若干个连续的第一窗口合并为第二窗口,计算第二窗口Loess校正后的覆盖度及其覆盖度占比;候选CNV识别单元:用于利用环状二元分割算法识别染色体的断点位置,计算相邻断点间的CBS ratio,根据CBS ratio阈值识别候选CNV区域;假阳性过滤单元:用于计算候选CNV区域CBS ratio值的显著性水平P‑value,根据P‑value过滤假阳性区域,获得待测样本的CNV区域和核型结果。
【技术特征摘要】
1.一种染色体异常检测装置,包括:测序数据获取单元:用于获取经高通量测序得到的读长片段;比对单元:用于将读长片段与人类基因组参考序列进行比对,获取读长片段的位置信息和长度信息;覆盖度计算单元:用于将人类基因组参考序列划分成若干个第一窗口,根据读长片段的位置信息和长度信息,计算各第一窗口的覆盖度,根据第一窗口的覆盖度和GC含量进行Loess校正;将若干个连续的第一窗口合并为第二窗口,计算第二窗口Loess校正后的覆盖度及其覆盖度占比;候选CNV识别单元:用于利用环状二元分割算法识别染色体的断点位置,计算相邻断点间的CBSratio,根据CBSratio阈值识别候选CNV区域;假阳性过滤单元:用于计算候选CNV区域CBSratio值的显著性水平P-value,根据P-value过滤假阳性区域,获得待测样本的CNV区域和核型结果。2.根据权利要求1所述的装置,其特征在于:覆盖度=区段内所覆盖的碱基总数/区段长度;覆盖度占比=区段的覆盖度/所有常染色体的覆盖度。3.根据权利要求1所述的装置,其特征在于:CBSratio为环状二元分割算法识别的相邻断点间所有第二窗口覆盖度占比的均值。4.根据权利要求1所述的装置,其特征在于:覆盖度计算单元中,所述第一窗口为10~50Kb的非重复区段,优选地,所述第一窗口为20Kb的非重复区段。5.根据权利要求...
【专利技术属性】
技术研发人员:糜庆丰,彭春方,张娟,赵宇,陈样宜,饶兴蔷,罗东红,黄铨飞,刘丽菲,
申请(专利权)人:东莞博奥木华基因科技有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。