A method for determining known or suspected copy number variations (CNV) associated with multiple medical conditions is disclosed. In some implementations, methods for determining fetal copy number variations using maternal samples containing maternal and fetal acellular DNA are provided. In some implementations, methods are provided for determining CNVs known or suspected to be associated with various medical conditions. Some implementations disclosed herein provide a method to improve the sensitivity and/or specificity of sequential data analysis by deriving fragment size parameters. In some embodiments, information from fragments of different sizes is used to evaluate copy number variations. In some embodiments, one or more t* statistics obtained from the coverage information of the target sequence are used to evaluate copy number variations. In some embodiments, one or more fetal fraction estimates are combined with one or more t_statistics to determine copy number variations.
【技术实现步骤摘要】
【国外来华专利技术】使用无细胞DNA片段尺寸以确定拷贝数变异相关申请的交叉引用本申请根据35U.S.C.§119(e)要求于2016年2月3日提交的题为:USINGCELL-FREEDNAFRAGMENTSIZETODETERMINECOPYNUMBERVARIATIONS的美国临时专利申请No.62/290,891,以及2016年12月16日提交的题为:USINGCELL-FREEDNAFRAGMENTSIZETODETERMINECOPYNUMBERVARIATIONS的美国专利申请No.15/382,508的权益,其出于所有目的通过引用整体并入本文。
技术介绍
人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已鉴定出特定基因和/或关键诊断标记物。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常发生的遗传病变。在癌症中,整个染色体或染色体区段的拷贝的缺失或倍增,以及基因组的特定区域的更高水平的扩增是常见的事件。关于拷贝数变异(CNV)的大部分信息都是通过允许识别结构异常的细胞遗传学解析所提供的。用于遗传筛选和生物剂量测定的常规方法利用侵入性方法,例如羊膜穿刺术、脐带穿刺术或绒毛膜绒毛取样(CVS),以获得用于分析核型的细胞。认识到需要不需要细胞培养的更快速的测试方法,荧光原位杂交(FISH)、定量荧光PCR(QF-PCR)和阵列-比较基因组杂交(阵列-CGH)已被开发为分子-细胞遗传学方法以用于分析拷贝数变异。人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已 ...
【技术保护点】
1.用于确定测试样品中的目标核酸序列的拷贝数变异(CNV)的方法,所述测试样品包含源自两个或更多个基因组的无细胞核酸片段,所述方法包括:(a)接收通过对所述测试样品中的所述无细胞核酸片段进行测序所获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t‑统计量;以及(f)使用从所述t‑统计量计算的似然比和关于所述无细胞核酸片段尺寸的信息,确定所述目标序列中的拷贝数变异。
【技术特征摘要】
【国外来华专利技术】2016.02.03 US 62/290,891;2016.12.16 US 15/382,5081.用于确定测试样品中的目标核酸序列的拷贝数变异(CNV)的方法,所述测试样品包含源自两个或更多个基因组的无细胞核酸片段,所述方法包括:(a)接收通过对所述测试样品中的所述无细胞核酸片段进行测序所获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t-统计量;以及(f)使用从所述t-统计量计算的似然比和关于所述无细胞核酸片段尺寸的信息,确定所述目标序列中的拷贝数变异。2.如权利要求1所述的方法,其包括进行(d)和(e)两次,一次用于第一尺寸域中的片段以及另一次用于第二尺寸域中的片段。3.如权利要求2所述的方法,其中所述第一尺寸域包括所述样品中基本上所有尺寸的无细胞核酸片段,并且所述第二尺寸域仅包括小于限定尺寸的无细胞核酸片段。4.如权利要求2所述的方法,其中所述第二尺寸域仅包括小于约150bp的无细胞核酸片段。5.如权利要求2所述的方法,其中由使用第一尺寸范围内的片段的序列标签的目标序列的第一t-统计量,以及使用第二尺寸范围内的片段的序列标签的目标序列的第二t-统计量来计算所述似然比。6.如权利要求1所述的方法,其中将所述似然比计算为所述测试样品是非整倍体样品的第一似然性除以所述测试样品是整倍体样品的第二似然性。7.如权利要求1所述的方法,其中除了所述t-统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算所述似然比。8.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用所述关于无细胞核酸片段尺寸的信息所计算的胎儿分数的值。9.如权利要求8所述的方法,其中通过以下计算所述胎儿分数的值:获得所述片段尺寸的频率分布;和将所述频率分布应用于使胎儿分数与片段尺寸频率相关联的模型,以获得所述胎儿分数值。10.如权利要求8所述的方法,其中所述使胎儿分数与片段尺寸频率相关联的模型包括具有对于多个片段尺寸的多个项和系数的一般线性模型。11.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用所述参考基因组的箱的覆盖率信息所计算的胎儿分数的值。12.如权利要求11所述的方法,其中通过以下来计算所述胎儿分数的值:将多个箱的覆盖率值应用于使胎儿分数与箱覆盖率相关联的模型,以获得胎儿分数值。13.如权利要求12所述的方法,其中所述使胎儿分数与箱覆盖率相关联的模型包括具有对于多个箱的多个项和系数的一般线性模型。14.如权利要求13所述的方法,其中所述多个箱在训练样品中具有胎儿分数和覆盖率之间的高度相关性。15.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用在所述读取中发现的多个8-聚体的频率所计算的胎儿分数的值。16.如权利要求15所述的方法,其中通过以下计算所述胎儿分数的值:将多个8-聚体的频率应用于使胎儿分数与8-聚体频率相关联的模型,以获得所述胎儿分数值。17.如权利要求16所述的方法,其中所述使胎儿分数与8-聚体频率相关联的模型包括具有对于多个8-聚体的多个项和系数的一般线性模型。18.如权利要求17所述的方法,其中所述多个8-聚体具有胎儿分数和8-聚体频率之间的高度相关性。19.如权利要求7所述的方法,其中所述胎儿分数的一个或多个值包括使用性染色体箱的覆盖率信息所计算的胎儿分数的值。20.如权利要求7所述的方法,其中所述似然比是从胎儿分数、短片段的t-统计量和所有片段的t统计量所计算的,其中所述短片段是在小于标准尺寸的第一尺寸范围内的无细胞核酸片段,并且所述所有片段是包括短片段和长于标准尺寸的片段的无细胞核酸片段。21.如权利要求20所述的方法,其中由以下计算所述似然比:其中p1表示数据来自代表3拷贝或1拷贝模型的多元正态分布的似然性,p0表示数据来自代表2拷贝模型的多元正态分布的似然性,T短、T所有是由短片段和所有片段产生的染色体覆盖率所计算的T评分,以及q(ff总)是胎儿分数的密度分布。22.如权利要求1所述的方法,其中除了所述t-统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算所述似然比。23.如权利要求1所述的方法,其中计算X单体、X三体、13三体、18三体或21三体的似然比。24.如权利要求1所述的方法,其中将序列标签的数量归一化包括:针对所述样品的GC含量归一化,针对训练组的变异的全局波谱归一化,和/或针对从主组分分析获得的一个或多个组分归一化。25.如权利要求1所述的方法,其中所述目标序列是选自以下的人染色体:13号染色体、18号染色体、21号染色体、X染色体和Y染色体。26.如权利要求1所述的方法,其中所述参考区域选自:所有稳定染色体、不包含所述目标序列的稳定染色体、至少所述目标序列之外的至少一条染色体,以及选自所述稳定染色体的染色体亚组。27.如权利要求26所述的方法,其中所述参考区域包括已被确定能为一组训练样品提供最佳信号检测能力的稳定染色体。28.如权利要求1所述的方法,其还包括:对于每个箱,通过以下计算箱的尺寸参数的值:(i)由所述箱中无细胞核酸片段的尺寸确定所述尺寸参数的值,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将所述尺寸参数的值归一化;和使用所述目标序列中的箱的尺寸参数的值和所述目标序列的参考区域中的箱的尺寸参数的值,来确定所述目标序列的基于尺寸的t-统计量。29.如权利要求28所述的方法,其中由所述t-统计量和所述基于尺寸的t-统计量计算(f)的似然比。30.如权利要求28所述的方法,其中由所述基于尺寸的t-统计量和胎儿分数计算(f)的似然比。31.如权利要求1所述的方法,其还包括将所述似然比与调用标准进行比较,以确定所述目标序列中的拷贝数变异。32.如权利要求31所述的方法,其中在与所述调用标准进行比较之前,将所述似然比转换为log似然比。33.如权利要求31所述的方法,其中通过将不同标准应用于训练样品的训练组并选择提供限定的灵敏度和限定的选择性的标准来获得所述调用标准。34.如权利要求1所述的方法,其还包括获得多个似然比,并将所述多个似然比应用于决策树以确定所述样品的倍性情况。35.如权利要求1所述的方法,其还包括获得多个似然比和目标序列的一个或多个覆盖率值,并将多个似然比和所述目标序列的一个或多个覆盖率值应用于决策树以确定所述样品的倍性情况。36.用于评估测试样品中目标核酸序列的拷贝数的系统,所述系统包括:测序仪,其用于接收来自所述测试样品的核酸片段并提供所述测试样品的核酸序列信息;处理器;和一个或多个计算机可读存储介质,其上存储有用于在所述处理器上执行的以下指令:(a)接收通过对所述测试样品中的无细胞核酸片段进行测序而获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含所述目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)对于每个箱,通过以下计算所述参考基因组的箱的序列标签的覆盖率:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将与所述箱比对的序列标签的数量归一化;(e)使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率来确定所述目标序列的t-统计量;和(f)使用由所述t-统计量和关于无细胞核...
【专利技术属性】
技术研发人员:斯文·杜瓦尔德,大卫·A·康斯托克,卡塔林·巴巴里奥鲁,达利亚·I·丘多瓦,理查德·P·拉瓦,基思·W·琼斯,陈更新,迪米特里·斯库沃佐夫,
申请(专利权)人:维里纳塔健康公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。