使用无细胞DNA片段尺寸以确定拷贝数变异制造技术

技术编号:19559069 阅读:28 留言:0更新日期:2018-11-24 23:39
公开了用于确定已知或疑似与多种医学病况相关的拷贝数变异(CNV)的方法。在一些实施方案中,提供了使用包含母体和胎儿无细胞DNA的母体样品来确定胎儿的拷贝数变异的方法。在一些实施方案中,提供了用于确定已知或疑似与各种医学病况相关的CNV的方法。本文公开的一些实施方案提供了通过推导片段尺寸参数来提高序列数据分析的灵敏度和/或特异性的方法。在一些实施方式中,来自不同尺寸的片段的信息用于评估拷贝数变异。在一些实施方式中,从目标序列的覆盖率信息获得的一个或多个t‑统计量被用于评估拷贝数变异。在一些实施方式中,将一个或多个胎儿分数估值与一个或多个t‑统计量组合以确定拷贝数变异。

Using the size of acellular DNA fragments to determine copy number variations

A method for determining known or suspected copy number variations (CNV) associated with multiple medical conditions is disclosed. In some implementations, methods for determining fetal copy number variations using maternal samples containing maternal and fetal acellular DNA are provided. In some implementations, methods are provided for determining CNVs known or suspected to be associated with various medical conditions. Some implementations disclosed herein provide a method to improve the sensitivity and/or specificity of sequential data analysis by deriving fragment size parameters. In some embodiments, information from fragments of different sizes is used to evaluate copy number variations. In some embodiments, one or more t* statistics obtained from the coverage information of the target sequence are used to evaluate copy number variations. In some embodiments, one or more fetal fraction estimates are combined with one or more t_statistics to determine copy number variations.

【技术实现步骤摘要】
【国外来华专利技术】使用无细胞DNA片段尺寸以确定拷贝数变异相关申请的交叉引用本申请根据35U.S.C.§119(e)要求于2016年2月3日提交的题为:USINGCELL-FREEDNAFRAGMENTSIZETODETERMINECOPYNUMBERVARIATIONS的美国临时专利申请No.62/290,891,以及2016年12月16日提交的题为:USINGCELL-FREEDNAFRAGMENTSIZETODETERMINECOPYNUMBERVARIATIONS的美国专利申请No.15/382,508的权益,其出于所有目的通过引用整体并入本文。
技术介绍
人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已鉴定出特定基因和/或关键诊断标记物。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常发生的遗传病变。在癌症中,整个染色体或染色体区段的拷贝的缺失或倍增,以及基因组的特定区域的更高水平的扩增是常见的事件。关于拷贝数变异(CNV)的大部分信息都是通过允许识别结构异常的细胞遗传学解析所提供的。用于遗传筛选和生物剂量测定的常规方法利用侵入性方法,例如羊膜穿刺术、脐带穿刺术或绒毛膜绒毛取样(CVS),以获得用于分析核型的细胞。认识到需要不需要细胞培养的更快速的测试方法,荧光原位杂交(FISH)、定量荧光PCR(QF-PCR)和阵列-比较基因组杂交(阵列-CGH)已被开发为分子-细胞遗传学方法以用于分析拷贝数变异。人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已鉴定出特定基因和/或关键诊断标记物。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常发生的遗传病变。在癌症中,整个染色体或染色体区段的拷贝的缺失或倍增,以及基因组的特定区域的更高水平的扩增是常见的事件。关于拷贝数变异(CNV)的大部分信息都是通过允许识别结构异常的细胞遗传学解析所提供的。用于遗传筛选和生物剂量测定的常规方法利用侵入性方法,例如羊膜穿刺术、脐带穿刺术或绒毛膜绒毛取样(CVS),以获得用于分析核型的细胞。认识到需要不需要细胞培养的更快速的测试方法,荧光原位杂交(FISH)、定量荧光PCR(QF-PCR)和阵列-比较基因组杂交(阵列-CGH)已被开发为分子-细胞遗传学方法以用于分析拷贝数变异。允许在相对短的时间内对整个基因组进行测序的技术的出现,以及循环的无细胞DNA(cfDNA)的发现提供了将来自一条染色体的遗传物质与另一条染色体的遗传物质进行比较的机会而没有与侵入性采样方法相关的风险,这提供了一种工具来诊断目标遗传序列的各种拷贝数变异。非侵入性产前诊断中现有方法的局限性,包括源于有限水平的cfDNA的灵敏度不足,以及源于基因组信息固有性质的技术的测序偏差,这些是对提供任何或所有特异性、灵敏度和适用性以在各种临床环境中可靠地诊断拷贝数变化的非侵入性方法的持续需求的基础。已经显示胎儿cfDNA片段的平均长度短于孕妇血浆中的母体cfDNA片段。母体和胎儿cfDNA之间的这种差异在本文的实施方式中被利用以确定CNV和/或胎儿分数。本文公开的实施方案满足了一些上述需求。一些实施方案可以用无PCR的文库制备物与成对的末端DNA测序结合实施。一些实施方案为非侵入性产前诊断和各种疾病的诊断提供高分析灵敏度和特异性。专利技术概述在一些实施方案中,提供了用于确定任何胎儿非整倍性的拷贝数变异(CNV)和已知或疑似与多种医学病况相关的CNV的方法。可以根据本方法确定的CNV包括1-22号染色体、X染色体和Y染色体中的任一个或多个的三体性和单体性、其它染色体多体性以及所述染色体中的任一个或多个的区段的缺失和/或重复。在一些实施方案中,该方法涉及在测试样品中鉴定目标核酸序列如临床相关序列的CNV。该方法评估了特定目标序列的拷贝数变异。在一些实施方案中,该方法在计算机系统中实施,该计算机系统包括一个或多个处理器和系统存储器以评估包含一个或多个基因组的核酸的测试样品中的目标核酸序列的拷贝数。本公开的一方面涉及一种用于确定包括源自两个或更多个基因组的无细胞核酸片段的测试样品中的目标核酸序列的拷贝数变异(CNV)的方法。该方法包括:(a)接收通过对测试样品中的无细胞核酸片段进行测序所获得的序列读取;(b)将无细胞核酸片段的序列读取或含有序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中参考基因组被分为多个箱;(c)确定测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)通过以下,对于每个箱,计算参考基因组箱的序列标签覆盖率:(i)确定与箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将与箱比对的序列标签的数量归一化;(e)使用目标序列中的箱覆盖率和目标序列的参考区域中的箱覆盖率来确定目标序列的t-统计量;以及(f)使用从t-统计量和关于无细胞核酸片段尺寸的信息所计算的似然比,确定目标序列中的拷贝数变异。在一些实施方式中,该方法包括执行(d)和(e)两次,对第一尺寸域中的片段执行一次并对第二尺寸域中的片段再执行一次。在一些实施方式中,第一尺寸域包括样品中基本上所有尺寸的无细胞核酸片段,并且第二尺寸域仅包括小于限定尺寸的无细胞核酸片段。在一些实施方式中,第二尺寸域仅包括小于约150bp的无细胞核酸片段。在一些实施方式中,由使用第一尺寸范围内的片段的序列标签的目标序列的第一t-统计量,以及使用第二尺寸范围内的片段的序列标签的目标序列的第二t-统计量,计算似然比。在一些实施方式中,将似然比计算为测试样品是非整倍体样品的第一似然性除以测试样品是整倍体样品的第二似然性。在一些实施方式中,除了t-统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算似然比。在一些实施方式中,胎儿分数的一个或多个值包括使用关于无细胞核酸片段尺寸的信息所计算的胎儿分数值。在一些实施方式中,通过以下,计算胎儿分数值:获得片段尺寸的频率分布;并且将频率分布应用于使胎儿分数与片段尺寸频率相关联的模型,以获得胎儿分数值。在一些实施方式中,将胎儿分数与片段尺寸频率相关联的模型包括具有对于多个片段尺寸的多个项和系数的一般线性模型。在一些实施方式中,胎儿分数的一个或多个值包括使用参考基因组的箱的覆盖率信息所计算的胎儿分数值。在一些实施方式中,通过以下,计算胎儿分数值:将多个箱的覆盖率值应用于使胎儿分数与箱的覆盖率相关联的模型,以获得胎儿分数值。在一些实施方式中,使胎儿分数与箱覆盖率相关联的模型包括具有对于多个箱的多个项和系数的一般线性模型。在一些实施方式中,多个箱在训练样品中具有胎儿分数和覆盖率之间的高度相关性。在一些实施方式中,胎儿分数的一个或多个值包括使用在读取中发现的多个8-聚体的频率所计算的胎儿分数值。在一些实施方式中,通过以下,计算胎儿分数值:将多个8-聚体的频率应用于使胎儿分数与8-聚体频率相关联的模型,以获得胎儿分数值。在一些实施方式中,使胎儿分数与8-聚体频率相关联的模型包括具有对于多个8-聚体的多个项和系数的一般线性模型。在一些实施方式中,多个8-聚体具有胎儿分数和8-聚体频率之间的高度相关性。在一些实本文档来自技高网...

【技术保护点】
1.用于确定测试样品中的目标核酸序列的拷贝数变异(CNV)的方法,所述测试样品包含源自两个或更多个基因组的无细胞核酸片段,所述方法包括:(a)接收通过对所述测试样品中的所述无细胞核酸片段进行测序所获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t‑统计量;以及(f)使用从所述t‑统计量计算的似然比和关于所述无细胞核酸片段尺寸的信息,确定所述目标序列中的拷贝数变异。

【技术特征摘要】
【国外来华专利技术】2016.02.03 US 62/290,891;2016.12.16 US 15/382,5081.用于确定测试样品中的目标核酸序列的拷贝数变异(CNV)的方法,所述测试样品包含源自两个或更多个基因组的无细胞核酸片段,所述方法包括:(a)接收通过对所述测试样品中的所述无细胞核酸片段进行测序所获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t-统计量;以及(f)使用从所述t-统计量计算的似然比和关于所述无细胞核酸片段尺寸的信息,确定所述目标序列中的拷贝数变异。2.如权利要求1所述的方法,其包括进行(d)和(e)两次,一次用于第一尺寸域中的片段以及另一次用于第二尺寸域中的片段。3.如权利要求2所述的方法,其中所述第一尺寸域包括所述样品中基本上所有尺寸的无细胞核酸片段,并且所述第二尺寸域仅包括小于限定尺寸的无细胞核酸片段。4.如权利要求2所述的方法,其中所述第二尺寸域仅包括小于约150bp的无细胞核酸片段。5.如权利要求2所述的方法,其中由使用第一尺寸范围内的片段的序列标签的目标序列的第一t-统计量,以及使用第二尺寸范围内的片段的序列标签的目标序列的第二t-统计量来计算所述似然比。6.如权利要求1所述的方法,其中将所述似然比计算为所述测试样品是非整倍体样品的第一似然性除以所述测试样品是整倍体样品的第二似然性。7.如权利要求1所述的方法,其中除了所述t-统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算所述似然比。8.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用所述关于无细胞核酸片段尺寸的信息所计算的胎儿分数的值。9.如权利要求8所述的方法,其中通过以下计算所述胎儿分数的值:获得所述片段尺寸的频率分布;和将所述频率分布应用于使胎儿分数与片段尺寸频率相关联的模型,以获得所述胎儿分数值。10.如权利要求8所述的方法,其中所述使胎儿分数与片段尺寸频率相关联的模型包括具有对于多个片段尺寸的多个项和系数的一般线性模型。11.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用所述参考基因组的箱的覆盖率信息所计算的胎儿分数的值。12.如权利要求11所述的方法,其中通过以下来计算所述胎儿分数的值:将多个箱的覆盖率值应用于使胎儿分数与箱覆盖率相关联的模型,以获得胎儿分数值。13.如权利要求12所述的方法,其中所述使胎儿分数与箱覆盖率相关联的模型包括具有对于多个箱的多个项和系数的一般线性模型。14.如权利要求13所述的方法,其中所述多个箱在训练样品中具有胎儿分数和覆盖率之间的高度相关性。15.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用在所述读取中发现的多个8-聚体的频率所计算的胎儿分数的值。16.如权利要求15所述的方法,其中通过以下计算所述胎儿分数的值:将多个8-聚体的频率应用于使胎儿分数与8-聚体频率相关联的模型,以获得所述胎儿分数值。17.如权利要求16所述的方法,其中所述使胎儿分数与8-聚体频率相关联的模型包括具有对于多个8-聚体的多个项和系数的一般线性模型。18.如权利要求17所述的方法,其中所述多个8-聚体具有胎儿分数和8-聚体频率之间的高度相关性。19.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用性染色体箱的覆盖率信息所计算的胎儿分数的值。20.如权利要求7所述的方法,其中所述似然比是从胎儿分数、短片段的t-统计量和所有片段的t统计量所计算的,其中所述短片段是在小于标准尺寸的第一尺寸范围内的无细胞核酸片段,并且所述所有片段是包括短片段和长于标准尺寸的片段的无细胞核酸片段。21.如权利要求20所述的方法,其中由以下计算所述似然比:其中p1表示数据来自代表3拷贝或1拷贝模型的多元正态分布的似然性,p0表示数据来自代表2拷贝模型的多元正态分布的似然性,T短、T所有是由短片段和所有片段产生的染色体覆盖率所计算的T评分,以及q(ff总)是胎儿分数的密度分布。22.如权利要求1所述的方法,其中除了所述t-统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算所述似然比。23.如权利要求1所述的方法,其中计算X单体、X三体、13三体、18三体或21三体的似然比。24.如权利要求1所述的方法,其中将序列标签的数量归一化包括:针对所述样品的GC含量归一化,针对训练组的变异的全局波谱归一化,和/或针对从主组分分析获得的一个或多个组分归一化。25.如权利要求1所述的方法,其中所述目标序列是选自以下的人染色体:13号染色体、18号染色体、21号染色体、X染色体和Y染色体。26.如权利要求1所述的方法,其中所述参考区域选自:所有稳定染色体、不包含所述目标序列的稳定染色体、至少所述目标序列之外的至少一条染色体,以及选自所述稳定染色体的染色体亚组。27.如权利要求26所述的方法,其中所述参考区域包括已被确定能为一组训练样品提供最佳信号检测能力的稳定染色体。28.如权利要求1所述的方法,其还包括:对于每个箱,通过以下计算箱的尺寸参数的值:(i)由所述箱中无细胞核酸片段的尺寸确定所述尺寸参数的值,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将所述尺寸参数的值归一化;和使用所述目标序列中的箱的尺寸参数的值和所述目标序列的参考区域中的箱的尺寸参数的值,来确定所述目标序列的基于尺寸的t-统计量。29.如权利要求28所述的方法,其中由所述t-统计量和所述基于尺寸的t-统计量计算(f)的似然比。30.如权利要求28所述的方法,其中由所述基于尺寸的t-统计量和胎儿分数计算(f)的似然比。31.如权利要求1所述的方法,其还包括将所述似然比与调用标准进行比较,以确定所述目标序列中的拷贝数变异。32.如权利要求31所述的方法,其中在与所述调用标准进行比较之前,将所述似然比转换为log似然比。33.如权利要求31所述的方法,其中通过将不同标准应用于训练样品的训练组并选择提供限定的灵敏度和限定的选择性的标准来获得所述调用标准。34.如权利要求1所述的方法,其还包括获得多个似然比,并将所述多个似然比应用于决策树以确定所述样品的倍性情况。35.如权利要求1所述的方法,其还包括获得多个似然比和目标序列的一个或多个覆盖率值,并将多个似然比和所述目标序列的一个或多个覆盖率值应用于决策树以确定所述样品的倍性情况。36.用于评估测试样品中目标核酸序列的拷贝数的系统,所述系统包括:测序仪,其用于接收来自所述测试样品的核酸片段并提供所述测试样品的核酸序列信息;处理器;和一个或多个计算机可读存储介质,其上存储有用于在所述处理器上执行的以下指令:(a)接收通过对所述测试样品中的无细胞核酸片段进行测序而获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含所述目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组的箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t-统计量;和(f)使用由所述t-统计量和关于无细胞核...

【专利技术属性】
技术研发人员:斯文·杜瓦尔德大卫·A·康斯托克卡塔林·巴巴里奥鲁达利亚·I·丘多瓦理查德·P·拉瓦基思·W·琼斯陈更新迪米特里·斯库沃佐夫
申请(专利权)人:维里纳塔健康公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1