使用无细胞DNA片段尺寸以确定拷贝数变异制造技术

技术编号:29221903 阅读:60 留言:0更新日期:2021-07-10 01:02
公开了用于确定已知或疑似与多种医学病况相关的拷贝数变异(CNV)的方法。在一些实施方案中,提供了使用包含母体和胎儿无细胞DNA的母体样品来确定胎儿的拷贝数变异的方法。在一些实施方案中,提供了用于确定已知或疑似与各种医学病况相关的CNV的方法。本文公开的一些实施方案提供了通过推导片段尺寸参数来提高序列数据分析的灵敏度和/或特异性的方法。在一些实施方式中,来自不同尺寸的片段的信息用于评估拷贝数变异。在一些实施方式中,从目标序列的覆盖率信息获得的一个或多个t

【技术实现步骤摘要】
使用无细胞DNA片段尺寸以确定拷贝数变异
[0001]相关申请的交叉引用
[0002]本申请是中国专利申请201680084307.1号的分案申请,并要求于2016年2月3日提交的题为:USING CELL

FREE DNA FRAGMENT SIZE TO DETERMINE COPY NUMBER VARIATIONS的美国临时专利申请No.62/290,891,以及2016年12月16日提交的题为:USING CELL

FREE DNA FRAGMENT SIZE TO DETERMINE COPY NUMBER VARIATIONS的美国专利申请No.15/382,508的权益,其出于所有目的通过引用整体并入本文。

技术介绍

[0003]人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已鉴定出特定基因和/或关键诊断标记物。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常发生的遗传病变。在癌症中,整个染色体或染色体区段的拷贝的缺失或倍增,以及基因组的特定区域的更高水平的扩增是常见的事件。
[0004]关于拷贝数变异(CNV)的大部分信息都是通过允许识别结构异常的细胞遗传学解析所提供的。用于遗传筛选和生物剂量测定的常规方法利用侵入性方法,例如羊膜穿刺术、脐带穿刺术或绒毛膜绒毛取样(CVS),以获得用于分析核型的细胞。认识到需要不需要细胞培养的更快速的测试方法,荧光原位杂交(FISH)、定量荧光PCR(QF

PCR)和阵列

比较基因组杂交(阵列

CGH)已被开发为分子

细胞遗传学方法以用于分析拷贝数变异。
[0005]人类医学研究的关键努力之一是发现产生不良健康后果的遗传异常。在许多情况下,在基因组的以异常拷贝存在的部分中已鉴定出特定基因和/或关键诊断标记物。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常发生的遗传病变。在癌症中,整个染色体或染色体区段的拷贝的缺失或倍增,以及基因组的特定区域的更高水平的扩增是常见的事件。
[0006]关于拷贝数变异(CNV)的大部分信息都是通过允许识别结构异常的细胞遗传学解析所提供的。用于遗传筛选和生物剂量测定的常规方法利用侵入性方法,例如羊膜穿刺术、脐带穿刺术或绒毛膜绒毛取样(CVS),以获得用于分析核型的细胞。认识到需要不需要细胞培养的更快速的测试方法,荧光原位杂交(FISH)、定量荧光PCR(QF

PCR)和阵列

比较基因组杂交(阵列

CGH)已被开发为分子

细胞遗传学方法以用于分析拷贝数变异。
[0007]允许在相对短的时间内对整个基因组进行测序的技术的出现,以及循环的无细胞DNA(cfDNA)的发现提供了将来自一条染色体的遗传物质与另一条染色体的遗传物质进行比较的机会而没有与侵入性采样方法相关的风险,这提供了一种工具来诊断目标遗传序列的各种拷贝数变异。
[0008]非侵入性产前诊断中现有方法的局限性,包括源于有限水平的cfDNA的灵敏度不足,以及源于基因组信息固有性质的技术的测序偏差,这些是对提供任何或所有特异性、灵敏度和适用性以在各种临床环境中可靠地诊断拷贝数变化的非侵入性方法的持续需求的基础。已经显示胎儿cfDNA片段的平均长度短于孕妇血浆中的母体cfDNA片段。母体和胎儿
cfDNA之间的这种差异在本文的实施方式中被利用以确定CNV和/或胎儿分数。本文公开的实施方案满足了一些上述需求。一些实施方案可以用无PCR的文库制备物与成对的末端DNA测序结合实施。一些实施方案为非侵入性产前诊断和各种疾病的诊断提供高分析灵敏度和特异性。
[0009]专利技术概述
[0010]在一些实施方案中,提供了用于确定任何胎儿非整倍性的拷贝数变异(CNV)和已知或疑似与多种医学病况相关的CNV的方法。可以根据本方法确定的CNV包括1

22号染色体、X染色体和Y染色体中的任一个或多个的三体性和单体性、其它染色体多体性以及所述染色体中的任一个或多个的区段的缺失和/或重复。在一些实施方案中,该方法涉及在测试样品中鉴定目标核酸序列如临床相关序列的CNV。该方法评估了特定目标序列的拷贝数变异。
[0011]在一些实施方案中,该方法在计算机系统中实施,该计算机系统包括一个或多个处理器和系统存储器以评估包含一个或多个基因组的核酸的测试样品中的目标核酸序列的拷贝数。
[0012]本公开的一方面涉及一种用于确定包括源自两个或更多个基因组的无细胞核酸片段的测试样品中的目标核酸序列的拷贝数变异(CNV)的方法。该方法包括:(a)接收通过对测试样品中的无细胞核酸片段进行测序所获得的序列读取;(b)将无细胞核酸片段的序列读取或含有序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中参考基因组被分为多个箱;(c)确定测试样品中存在的至少一些无细胞核酸片段的片段尺寸;(d)通过以下,对于每个箱,计算参考基因组箱的序列标签覆盖率:(i)确定与箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将与箱比对的序列标签的数量归一化;(e)使用目标序列中的箱覆盖率和目标序列的参考区域中的箱覆盖率来确定目标序列的t

统计量;以及(f)使用从t

统计量和关于无细胞核酸片段尺寸的信息所计算的似然比,确定目标序列中的拷贝数变异。
[0013]在一些实施方式中,该方法包括执行(d)和(e)两次,对第一尺寸域中的片段执行一次并对第二尺寸域中的片段再执行一次。在一些实施方式中,第一尺寸域包括样品中基本上所有尺寸的无细胞核酸片段,并且第二尺寸域仅包括小于限定尺寸的无细胞核酸片段。在一些实施方式中,第二尺寸域仅包括小于约150bp的无细胞核酸片段。在一些实施方式中,由使用第一尺寸范围内的片段的序列标签的目标序列的第一t

统计量,以及使用第二尺寸范围内的片段的序列标签的目标序列的第二t

统计量,计算似然比。
[0014]在一些实施方式中,将似然比计算为测试样品是非整倍体样品的第一似然性除以测试样品是整倍体样品的第二似然性。
[0015]在一些实施方式中,除了t

统计量和关于无细胞核酸片段尺寸的信息之外,从胎儿分数的一个或多个值计算似然比。
[0016]在一些实施方式中,胎儿分数的一个或多个值包括使用关于无细胞核酸片段尺寸的信息所计算的胎儿分数值。在一些实施方式中,通过以下,计算胎儿分数值:获得片段尺寸的频率分布;并且将频率分布应用于使胎儿分数与片段尺寸频率相关联的模型,以获得胎儿分数值。在一些实施方式中,将胎儿分数与片段尺寸频率相关联的模型包括具有对于多个片段尺寸的多个项和系数的一般线性模型。
[0017]在一些实施方式中,胎儿分数的一本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于确定测试样品中的目标核酸序列的拷贝数变异(CNV)的系统,所述测试样品包括来源于两个或多个基因组的无细胞核酸片段,所述系统包括一个或多个处理器和系统存储器,所述一个或多个处理器被配置为:(a)接收通过对所述测试样品中的无细胞核酸片段进行测序而获得的序列读取;(b)将所述无细胞核酸片段的序列读取或含有所述序列读取的片段与包含目标序列的参考基因组的箱进行比对,从而提供测试序列标签,其中所述参考基因组被分为多个箱;(c)确定所述测试样品中存在的无细胞核酸片段的片段尺寸;(d)使用具有在第一尺寸域内的尺寸的无细胞核酸片段的序列标签,获得所述参数基因组的箱的序列标签第一覆盖率;(e)使用具有在第二尺寸域内的尺寸的无细胞核酸片段的序列标签,获得所述参数基因组的箱的序列标签第二覆盖率,其中所述第二尺寸域不同于所述第一尺寸域;(f)使用所述第一覆盖率和第二覆盖率,确定所述目标序列中的拷贝数变异。2.如权利要求1所述的系统,其中所述一个或多个处理器被配置为:使用(c)中确定的片段尺寸,计算所述参考基因组的箱的尺寸特征,其中使用所述尺寸特征、第一覆盖率和第二覆盖率,确定拷贝数变异。3.如权利要求1所述的系统,其中所述第一尺寸域包括所述样品中所有尺寸的无细胞核酸片段,并且所述第二尺寸域仅包括小于限定尺寸的无细胞核酸片段。4.如权利要求3所述的系统,其中所述第二尺寸域仅包括小于150bp的无细胞核酸片段。5.如权利要求1所述的系统,其中(f)包括从所述第一覆盖率和第二覆盖率计算倍性似然性,所述倍性似然性包括第一概率和第二概率,所述第一概率为所述第一覆盖率和第二覆盖率或从它们衍生的统计量来自具有非整倍体假设的模型的概率,所述第二概率为所述第一覆盖率和第二覆盖率或从它们衍生的统计量来自具有整倍体假设的模型的概率。6.如权利要求5所述的系统,其中所述统计量包括使用所述第一覆盖率计算的所述目标序列的第一t

统计量和使用所述第二覆盖率计算的所述目标序列的第二t

统计量。7.如权利要求6所述的系统,其中使用所述目标序列中的箱覆盖率和所述目标序列的参考区域中的箱覆盖率,计算所述目标序列的t

统计量。8.如权利要求7所述的系统,其中所述倍性似然性包括第一概率和第二概率之间的似然比。9.如权利要求8所述的系统,其中除了所述第一t

统计量和第二t

统计量之外,还从胎儿分数的一个或多个值计算所述似然比。10.如权利要求9所述的系统,其中所述一个或多个处理器被配置为:使用所述无细胞核酸片段的片段尺寸,计算胎儿分数的一个或多个值。11.如权利要求9所述的系统,其中所述似然比包括:其中p1表示数据来自代表3拷贝或1拷贝模型的多元正态分布的似然性,p0表示数据来自代表2拷贝模型的多元正态分布的似然性,T

、T
所有
是由短片段和所有片段产生的染色体
覆盖率所计算的T评分,以及q(ff

)是胎儿分数的密度分布。12.如权利要求11所述的系统,其中计算X单体、X三体、13三体、18三体或21三体的似然比。13.如权利要求1所述的系统,其中(d)和/或(e)包括:(i)确定与所述箱比对的序列标签的数量,和(ii)基于由于拷贝数变异以外的因素所导致的箱间变异,将与所述箱比对的序列标签的数量归一化。14.如权利要求13所述的系统,其中将序列标签的数量归一化包括:针对所述样品的GC含量归一化,针对训练组的变异的全局波谱归一化,和/或针对从主组分分析获得的一个或多个组分归一...

【专利技术属性】
技术研发人员:斯文
申请(专利权)人:维里纳塔健康公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1