循环肿瘤DNA拷贝数变异的检测方法和装置制造方法及图纸

技术编号:18526316 阅读:44 留言:0更新日期:2018-07-25 12:54
本发明专利技术公开了一种循环肿瘤DNA拷贝数变异的检测方法和装置。其中,该方法包括:分别通过正常人群基因数据和待测目标基因数据,确定正常人群测序结果和待测目标测序结果;获取第一捕获区间参数和第二捕获区间参数;分别对第一捕获区间参数和第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和第二捕获区间参数的第二深度;根据第一深度确定第一拷贝数变异得分;根据第一深度和第二深度确定第二拷贝数变异得分;根据第一拷贝数变异得分和第二拷贝数变异得分确定待测目标基因数据的拷贝数变异检测结果。本发明专利技术解决了现有技术中循环肿瘤DNA拷贝数变异检测准确度差的技术问题。

【技术实现步骤摘要】
循环肿瘤DNA拷贝数变异的检测方法和装置
本专利技术涉及基因领域,具体而言,涉及一种循环肿瘤DNA拷贝数变异的检测方法和装置。
技术介绍
循环肿瘤DNA(circulatingtumorDNA,ctDNA)是一种无细胞状态的胞外DNA,存在于血液、滑膜液、胸腹水和脑脊液等体液中,尤其是血浆游离DNA(cell-freeDNA,cfDNA)中含量丰富。其主要是由单链或双链DNA以及单链与双链DNA的混合物组成。它是一种具备广泛应用前景、高敏感性、高特异性的肿瘤标志物,且适用于多种肿瘤。通过ctDNA可以对肿瘤进行分期、预后的评估,以及动态监测。它携带的肿瘤信息也可用于用药指导,不光取样简单,还能更全面的掌握肿瘤的信息。目前,针对肿瘤患者血浆cfDNA的液体活检技术对肿瘤临床治疗和靶向药物用药指导已产生重要的监控和指导意义。DNA片段的拷贝数变异(copynumbervariation,CNV)是一种常见的基因组结构性变异形式,在人群中普遍存在。某些特定基因的CNV被认为可作为肿瘤进展和预后的临床指标,并具有指导肿瘤患者用药的潜力。目前,检测CNV的常用方式主要包括两大类实验方法:低通量分子生物学实验技术,包括:染色体显带、荧光原位杂交技术(FISH)、微滴式数字PCR(ddPCR)等;和高通量二代基因测序技术(nextgenerationsequencing,NGS),该技术可以在全基因组范围或者目标基因区间探测DNA片段的CNV。但上述几种拷贝数变异检测方式均存在一定缺陷,下面依次进行具体说明:低通量分子生物学实验技术主要缺陷包括:分辨率低,操作复杂,检测通量低,偏差大,具体的,染色体显带:分辨率低,无法检测到长度小于5Mb的变异,当细胞分裂指数低或染色体形态学表型差时,准确率较低。并且,在操作上需要进行细胞培养,耗时较长;FISH:目前临床病理检验基因CNV的金标准方法。相比染色体显带,虽然大大提升了分辨率,但探针数量有限,通量小、时间长。每次检测只能分析少数位点,需要在检测前对CNV的类型的位置有先验判断,所以只适合于针对个别位点进行验证,而非筛查。此外,不同实验室和检测机构对结果判断存在较大的偏差;ddPCR:在计算待测基因拷贝数变异时,会选取待测位置以外的点作为参考点,计算待测基因相对于参考基因的拷贝倍数,如果参考基因的拷贝数不为2(假设基因组为二倍体),待测基因的拷贝数检测结果也会产生偏差。与捕获测序相比,通量较小,探针可选取的位点有限,探针覆盖区间较短,难以确认断点位置,且仅能检测设计探针区间的基因,成本较高,适合用于验证而非筛查。相比之下,捕获测序在肿瘤组织样本CNV检测上具有较高的灵敏度,分辨率较高,但分析过程较为复杂。高通量捕获测序检测CNV技术的主要缺陷:无专门针对ctDNA进行捕获测序检测CNV的算法,现有分析方法过程复杂,灵敏度较低,结果稳定性差。例如:CNVkit:输出结果没有提示统计学意义,且较难解释。对于长基因,经常会出现单个基因被分入不同的CNV片段且推算的拷贝数不同的情况。此外,CNVkit仅给出一个对拷贝数的相对变化幅度(log2Ratio)的估计,对于片段是否为CNV并不进行检验,需要使用者自行设置阈值进行判断;Control-FREEC:最终的输出结果将拷贝数取整,所以对肿瘤细胞比例不明确或者比例比较低的样本检测效果不佳,并且该算法无法检测到拷贝数在2.5以下的CNV,对于ctDNA的CNV检测较为不利。虽然软件可以计算肿瘤DNA的纯度,并采用该百分比对最终的拷贝数结果进行校正,但由于对纯度的估计不准确,最终推定出的拷贝数结果可能会与实际情况存在较大的偏差。因此,该软件不适用于对ctDNA的鉴定。由此可知,目前针对捕获数据的分析软件,部分仅适用于全外显子测序,适用于非全外显子捕获数据的软件各自也存在一些缺陷。其中,并没有一款软件是针对ctDNA检测CNV设计的,对于扩增或缺失倍数细微的样本,灵敏度较低。由于ctDNA在血浆cfDNA里面含量比例较少,通常含量在1%一下,因此迫切需要开发一种灵敏度高,准确性高的CNV检测方法。针对现有技术中循环肿瘤DNA拷贝数变异检测准确度差的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种循环肿瘤DNA拷贝数变异的检测方法和装置,以至少解决现有技术中循环肿瘤DNA拷贝数变异检测准确度差的技术问题。根据本专利技术实施例的一个方面,提供了一种循环肿瘤DNA拷贝数变异的检测方法,包括:分别通过正常人群基因数据和待测目标基因数据,确定正常人群测序结果和待测目标测序结果;获取第一捕获区间参数和第二捕获区间参数,其中,第一捕获区间参数用于表征正常人群测序结果在捕获区间上的参数,第二捕获区间参数用于表征待测目标测序结果在捕获区间上的参数;分别对第一捕获区间参数和第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和第二捕获区间参数的第二深度;根据第一深度确定第一拷贝数变异得分,其中,第一拷贝数变异得分用于表征正常人群基因数据发生拷贝数变异的波动范围;根据第一深度和第二深度确定第二拷贝数变异得分,其中,第二拷贝数变异得分用于表征待测目标基因数据发生拷贝数变异的波动情况;将第二拷贝数变异得分和第一拷贝数变异得分进行比对,确定待测目标基因数据的拷贝数变异检测结果。根据本专利技术实施例的另一方面,还提供了一种拷贝数变异的检测装置,包括:确定模块,用于分别通过正常人群基因数据和待测目标基因数据,确定正常人群测序结果和待测目标测序结果;获取模块,用于获取第一捕获区间参数和第二捕获区间参数,其中,第一捕获区间参数用于表征正常人群测序结果在捕获区间上的参数,第二捕获区间参数用于表征待测目标测序结果在捕获区间上的参数;标准化处理模块,用于分别对第一捕获区间参数和第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和第二捕获区间参数的第二深度;第一打分模块,用于根据第一深度确定第一拷贝数变异得分,其中,第一拷贝数变异得分用于表征正常人群基因数据发生拷贝数变异的波动范围;第二打分模块,用于根据第一深度和第二深度确定第二拷贝数变异得分,其中,第二拷贝数变异得分用于表征待测目标基因数据发生拷贝数变异的波动情况;检测打分模块,用于根据第一拷贝数变异得分和第二拷贝数变异得分确定待测目标基因数据的拷贝数变异检测结果。根据本专利技术实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述的循环肿瘤DNA拷贝数变异的检测方法。根据本专利技术实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述的循环肿瘤DNA拷贝数变异的检测方法。在本专利技术实施例中,在计算正常人群的基因拷贝数变异得分,根据正常人群的基因拷贝数变异得分确定正常人群的拷贝数变异的得分范围,从而根据这一拷贝数变异得分确定的范围来检测待测目标的基因拷贝数,进而解决了由于设置不合适的拷贝数阈值所导致的现有技术中循环肿瘤DNA拷贝数变异检测准确度差的技术问题,达到了提高循环肿瘤DNA拷贝数变异检测准确度的目的。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明本文档来自技高网
...

【技术保护点】
1.一种循环肿瘤DNA拷贝数变异的检测方法,其特征在于,包括:分别通过正常人群基因数据和待测目标基因数据,确定所述正常人群测序结果和所述待测目标测序结果;获取第一捕获区间参数和第二捕获区间参数,其中,所述第一捕获区间参数用于表征所述正常人群测序结果在捕获区间上的参数,所述第二捕获区间参数用于表征所述待测目标测序结果在所述捕获区间上的参数;分别对所述第一捕获区间参数和所述第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和所述第二捕获区间参数的第二深度;根据所述第一深度确定第一拷贝数变异得分,其中,所述第一拷贝数变异得分用于表征所述正常人群基因数据发生拷贝数变异的波动范围;根据所述第一深度和所述第二深度确定第二拷贝数变异得分,其中,所述第二拷贝数变异得分用于表征所述待测目标基因数据发生拷贝数变异的波动情况;将所述第二拷贝数变异得分和所述第一拷贝数变异得分进行比对,确定所述待测目标基因数据的拷贝数变异检测结果。

【技术特征摘要】
2017.11.30 CN 20171123832721.一种循环肿瘤DNA拷贝数变异的检测方法,其特征在于,包括:分别通过正常人群基因数据和待测目标基因数据,确定所述正常人群测序结果和所述待测目标测序结果;获取第一捕获区间参数和第二捕获区间参数,其中,所述第一捕获区间参数用于表征所述正常人群测序结果在捕获区间上的参数,所述第二捕获区间参数用于表征所述待测目标测序结果在所述捕获区间上的参数;分别对所述第一捕获区间参数和所述第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和所述第二捕获区间参数的第二深度;根据所述第一深度确定第一拷贝数变异得分,其中,所述第一拷贝数变异得分用于表征所述正常人群基因数据发生拷贝数变异的波动范围;根据所述第一深度和所述第二深度确定第二拷贝数变异得分,其中,所述第二拷贝数变异得分用于表征所述待测目标基因数据发生拷贝数变异的波动情况;将所述第二拷贝数变异得分和所述第一拷贝数变异得分进行比对,确定所述待测目标基因数据的拷贝数变异检测结果。2.根据权利要求1所述的方法,其特征在于,所述捕获区间参数包括:测序读长数目、GC含量和区间长度,其中,所述测序读长数目、所述GC含量和所述区间长度对应的深度分别为:覆盖度、GC含量深度和区间长度深度,分别对所述第一捕获区间参数和所述第二捕获区间参数进行标准化处理,得到第一捕获区间参数的第一深度和第二捕获区间参数的第二深度,包括:对每个捕获区间的测序读长数目进行标准化处理,得到所述第一捕获区间参数的覆盖度和所述第二捕获区间参数的覆盖度;根据所述覆盖度和所述GC含量对所述GC含量进行标准化处理,得到所述第一捕获区间参数的GC含量深度和所述第二捕获区间参数的GC含量深度;根据所述GC含量深度和所述区间长度对所述区间长度进行标准化处理,得到所述第一捕获区间参数的捕获区间深度和所述第二捕获区间参数的区间长度深度。3.根据权利要求2所述的方法,其特征在于,对每个捕获区间的测序读长数目进行标准化处理,得到所述第一捕获区间参数的覆盖度和所述第二捕获区间参数的覆盖度,包括:通过如下公式对每个捕获区间的测序读长数目进行标准化处理,得到所述第一捕获区间参数的覆盖度和所述第二捕获区间参数的覆盖度:DepthAi=log2(RCi)-log2(RCm);其中,DepthAi是第i个捕获区间的测序读长数目标准化以后的覆盖度;RCi是第i个捕获区间上覆盖的测序读长数目;RCm为所有捕获区间中位于常染色体的捕获区间的测序读长数目中位数。4.根据权利要求3所述的方法,其特征在于,根据所述覆盖度和所述GC含量对所述GC含量进行标准化处理,得到所述第一捕获区间参数的GC含量深度和所述第二捕获区间参数的GC含量深度,包括:通过如下公式对所述GC含量进行标准化处理,得到所述第一捕获区间参数的GC含量深度和所述第二捕获区间参数的GC含量深度:DepthBi=DepthAi-rolling_median(All_region_GC)i;其中,DepthBi是第i个捕获区间的GC含量标准化以后的GC含量深度;DepthAi是第i个捕获区间的测序读长数目标准化以后的深度;rolling_median(All_region_GC)i是所有捕获区间按照GC含量由大至小排序后,第i个区间的测序读长数目标准化后的深度的滑动中值。5.根据权利要求4所述的方法,其特征在于,根据所述GC含量深度和所述区间长度对所述区间长度进行标准化处理,得到所述第一捕获区间参数的捕获区间深度和所述第二捕获区间参数的区间长度深度,包括:通过如下公式对所述区间长度进行标准化处理,得到所述第一捕获区间参数的捕获区间深度和所述第二捕获区间参数的区间长度深度:DepthCi=DepthBi-rolling_median(All_region_size)i;其中,DepthCi是第i个捕获区间的区间长度标准化以后的区间长度深度;DepthBi是第i个捕获区间GC含量标准化以后的深度;rolling_median(All_region_size)i是所有捕获区间按照区间长度由大至小排序以后,第i个区间的GC含量标准化后的深度的滑动中值。6.根据权利要求1所述的方法,其特征在于,根据所述第一深度确定第一拷贝数变异得分,包括:根据所述第一深度确定所述正常人群的第三拷贝数变异得分,其中,所述第三拷贝数变异得分用于表征所述正常人群基因数据在每个捕获区间内发生拷贝数变异的波动范围;根据所述第三拷贝数变异得分确定所述第一拷贝数变异得分。7.根据权利要求6所述的方法,其特征在于,根据所述第一深度确定所述正常人群的第三拷贝数变异得分,包括:通过如下公式根据所述第一深度确定所述正常人群的第三拷贝数变异得分:其中,RZi是所述正常人群单一样本第i个捕获区间的第三拷贝数变异得分;DepthCi是所述正常...

【专利技术属性】
技术研发人员:郭昊韩天澄于佳宁林小静宋雪
申请(专利权)人:臻和北京科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1