使用无细胞DNA片段大小来确定拷贝数变化制造技术

技术编号:32656010 阅读:18 留言:0更新日期:2022-03-17 11:03
公开的是用于确定已知或怀疑与多种医学状况相关的拷贝数变化(CNV)的方法。在一些实施方案中,提供方法用于使用包含母体和胎儿无细胞DNA的母体样本确定胎儿的拷贝数变化(CNV)。在一些实施方案中,提供方法用于确定已知或怀疑与多种医学状况相关的CNV。本文公开的一些实施方案提供方法以通过衍生片段大小参数,如大小范围内的大小加权的覆盖率或片段的分数来提高序列数据分析的灵敏度和/或特异性。在一些实施方案中,调整片段大小参数以去除样本内GC含量偏差。在一些实施方案中,去除样本内GC含量偏差基于为未受影响的训练样本之间常见的系统变异校正的序列数据。还公开的是用于评估目的序列的CNV的系统和计算机程序产品。产品。产品。

【技术实现步骤摘要】
使用无细胞DNA片段大小来确定拷贝数变化
[0001]本申请是申请日2015年12月11日,申请号201580075794.0,专利技术名称“使 用无细胞DNA片段大小来确定拷贝数变化”的中国专利技术专利申请的分案申请。
[0002]对相关申请的交叉引用
[0003]本申请要求2014年12月12日提交的题为USING CELL

FREE DNA FRAGMENT SIZE TO DETERMINE COPY NUMBER VARIATIONS的美国 临时专利申请号62/091,380的根据35U.S.C.
§
119(e)的权益,为全部目的以其 整体通过引用并入本文。
[0004]专利技术背景
[0005]人类医学研究的关键工作之一是发现遗传异常,其产生不良的健康后果。 在许多情况下,在以异常拷贝数存在的部分基因组中鉴定了特定基因和/或关 键的诊断标记。例如,在产前诊断中,整个染色体的额外或缺失拷贝是经常 发生的遗传损伤。在癌症中,全部染色体或染色体区段的拷贝的缺失或增殖 以及基因组特定区域的较高水平扩增是常见的事件。
[0006]关于拷贝数变化(CNV,copy number variation)的大多数信息已经通过 允许识别结构异常的细胞遗传学解析来提供。用于遗传筛选和生物剂量测定 的常规程序已经利用侵入性程序,例如羊膜穿刺术、脐穿刺或绒毛膜绒毛取 样(CVS),以获得用于核型分析的细胞。认识到对不需要细胞培养的更快 速的测试方法的需要,已经开发了荧光原位杂交(FISH)、定量荧光PCR (QF

PCR)和阵列比较基因组杂交(阵列

CGH)作为分子细胞遗传学方法 用于分析拷贝数变化。
[0007]人类医学研究的关键工作之一是发现遗传异常,其产生不良的健康后果。 在许多情况下,在以异常拷贝数存在的部分基因组中鉴定了特定基因和/或关 键的诊断标记。例如,在产前诊断中,整个染色体的额外或缺失的拷贝是经 常发生的遗传损伤。在癌症中,全部染色体或染色体区段的拷贝的缺失或增 殖以及基因组特定区域的较高水平扩增是常见的事件。
[0008]关于拷贝数变化(CNV)的大多数信息已经通过允许识别结构异常的细 胞遗传学解析来提供。用于遗传筛选和生物剂量测定的常规程序已经利用侵 入性程序,例如羊膜穿刺术、脐穿刺或绒毛膜绒毛取样(CVS),以获得用 于核型分析的细胞。认识到对不需要细胞培养的更快速的测试方法的需要, 已经开发了荧光原位杂交(FISH)、定量荧光PCR(QF

PCR)和阵列比较基 因组杂交(阵列

CGH)作为分子细胞遗传学方法用于分析拷贝数变化。
[0009]允许在相对短的时间内对整个基因组进行测序的技术的出现以及循环 的无细胞DNA(cfDNA)的发现提供了将起源于一条染色体的遗传物质与另 一条染色体的遗传物质进行比较而没有与侵入性取样方法相关风险的机会, 这提供了诊断目的遗传序列的各种拷贝数变化的工具。
[0010]现有的非侵入性产前诊断方法的局限性,其包括源于有限水平的cfDNA 的灵敏度不足,以及源于基因组信息固有性质的技术的测序偏差,这些都是 继续需要提供任何或全部特异性、灵敏度和适用性以可靠地诊断多种临床环 境中的拷贝数变化的非侵入性方法的基础。已经显示胎儿cfDNA片段的平均 长度比孕妇血浆中的母体cfDNA片段短。在本文的
实施方式中利用母体和胎 儿cfDNA之间的这种差异来确定CNV和/或胎儿级分。本文公开的实施方案 满足了上述一些需求。一些实施方案可以使用与配对末端DNA测序偶联的无 PCR文库制备来实现。一些实施方案为非侵入性产前诊断和多种疾病的诊断 提供高分析灵敏度和特异性。
[0011]专利技术概述
[0012]在一些实施方案中,提供了用于确定任何胎儿非整倍性的拷贝数变化 (CNV)和已知或怀疑与多种医学状况相关联的CNV的方法。可以根据本方 法确定的CNV包括1

22、X和Y染色体任何一条或多条的三体性和单体性, 其他染色体多体性,以及任何一个条或多条染色体的区段的缺失和/或复制。 在一些实施方案中,所述方法包括鉴定在测试样本中目的核酸序列,例如, 临床相关序列的CNV。该方法评估特定目的序列的拷贝数变化。
[0013]在一些实施方案中,该方法在包括一个或多个处理器和系统存储器的计 算机系统中实现,以评估包含一个或多个基因组的核酸的测试样本中目的核 酸序列的拷贝数。
[0014]本公开内容的一个方面涉及用于确定测试样本中目的核酸序列的拷贝 数变化的方法,所述测试样本包括源于两个或更多个基因组的无细胞核酸片 段。该方法包括(a)接收通过测序测试样本中的无细胞核酸片段获得的序 列读取(sequence read);(b)将无细胞核酸片段的序列读取与包含目的序列 的参考基因组比对,由此提供测试序列标签(test sequence tag),其中所述参 考基因组被分成多个箱体(bins);(c)确定存在于所述测试样本中的无细胞 核酸片段的大小;(d)基于从其获得标签的无细胞核酸片段的大小加权测试 序列标签;(e)基于加权的测试序列标签计算所述箱体的覆盖率(coverage); 和(f)从所计算的覆盖率中鉴定目的序列中的拷贝数变化。在一些实施方 案中,通过将覆盖率偏向从测试样本中一个基因组特征性的大小或大小范围 的无细胞核酸片段获得的测试序列标签进行测试序列标签的加权。在一些实 施方式中,通过将值1分配给从所述大小或大小范围的无细胞核酸片段获得 标签,并将值0分配给其他标签进行测试序列标签的加权。也就是说,只计 算所述大小或大小范围的片段以确定覆盖率。在一些实施方案中,覆盖率偏 向来自片段大小谱(fragment size spectrum)较短末端(shorter end)的片段 或短于特定值的标签。在一些实施方式中,覆盖率偏向来自片段大小范围中 的片段的标签,并且其中范围的上限是约150个碱基对或更少碱基对。
[0015]在上述方法的一些实施方式中,加权测试序列标签包括从(e)的计算 中排除从大小范围之外的无细胞核酸片段获得的标签。在一些实施方式中, 加权测试序列标签包括从(e)的计算中排除比特定值大的大小的片段。在 一些实施方式中,加权测试序列标签包括从(e)的计算中排除大于约150个 碱基对的大小的片段。
[0016]在一些实施方式中,基于加权标签的覆盖率相比于未加权的覆盖率在确 定拷贝数变化中提供了更高的灵敏度和更高的选择性。
[0017]在一些实施方式中,通过测序无细胞的核酸片段获得序列读取,而不首 先使用PCR扩增无细胞核酸片段的核酸。在一些实施方式中,通过测序无细 胞核酸片段至每个样本不超过约6M片段的深度来获得测序读取。在一些实 施方式中,通过测序无细胞核酸片段至每个样本不超过约1M片段的深度来 获得测序读取。在一些实施方式中,通过多重测序获得测序读取,其中多重 化样本(sampele multi本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.用于评估测试样本中目的核酸序列的拷贝数的系统,所述测试样本包含源自两个或更多个基因组的无细胞核酸片段,所述系统包括一个或多个处理器和系统存储器,所述一个或多个处理器配置为:使从所述测试样本中的所述无细胞核酸片段获得的序列读取与包含所述目的核酸序列的参考基因组比对,由此提供测试序列标签,其中所述参考基因组被分成多个箱体;获得所述测试样本中所述无细胞核酸片段的至少一些的大小;使用一个或多个权重值或一个或多个权重函数对所述测试序列标签加权,其中所述一个或多个权重值或权重函数基于获得所述测试序列标签的无细胞核酸片段的大小;基于加权的测试序列标签计算所述多个箱体的覆盖率;和从所计算的覆盖率中鉴定所述目的核酸序列中的拷贝数变化。2.权利要求1所述的系统,其中所述一个或多个权重值或一个或多个权重函数将所述覆盖率偏向从所述测试样本中一个基因组的特征性大小范围中的无细胞核酸片段获得的测试序列标签。3.权利要求2所述的系统,其中所述一个或多个权重函数包含非线性函数。4.权利要求3所述的系统,其中所述非线性函数包括赫维赛德阶跃函数。5.权利要求3所述的系统,其中所述非线性函数包括厢车函数。6.权利要求3所述的系统,其中所述非线性函数包括阶梯函数。7.权利要求3所述的系统,其中所述非线性函数包括S形函数。8.权利要求2所述的系统,其中所述一个或多个权重函数包括线性函数。9.权利要求2所述的系统,其中对所述测试序列标签加权包括排除从所述大小范围外的无细胞核酸片段获得的测试序列标签。10.权利要求9所述的系统,其中对所述测试序列标签加权包括排除大于约150个碱基对的大小的片段。11.权利要求1所述的系统,其中对所述测试序列标签加权包括通过乘法或求幂来修改测试序列标签的计数。12.权利要求1所述的系统,其还包括用于接收来自所述测试样本的无细胞核酸片段并提供来自所述测试样本的序列读取的测序仪。13.权利要求1所述的系统,其中所述两个或更多个基因组包括来自母亲和胎儿的基因组。14.权利要求13所述的...

【专利技术属性】
技术研发人员:DI丘杜瓦C巴巴西奥鲁S杜恩瓦尔德DA康斯托克RP拉瓦
申请(专利权)人:维里纳塔健康股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1