检测稀有突变和拷贝数变异的系统和方法技术方案

技术编号:11731355 阅读:510 留言:0更新日期:2015-07-15 03:34
本发明专利技术提供了用于检测无细胞多核苷酸中的稀有突变和拷贝数变异的系统和方法。通常,该系统和方法包括样品制备或从体液中提取和分离无细胞多核苷酸序列;随后通过本领域已知的技术对无细胞多核苷酸进行测序;以及应用生物信息学工具与参考相比检测稀有突变和拷贝数变异。该系统和方法还可包含不同疾病的不同稀有突变或拷贝数变异谱的数据库或集合,其将作为附加参考用于帮助疾病的稀有突变的检测、拷贝数变异谱分析或普通遗传谱分析。

【技术实现步骤摘要】
【国外来华专利技术】交叉引用本申请要求2012年9月4日提交的美国临时专利申请号61/696,734、2012年9月21日提交的美国临时专利申请号61/704,400、2013年3月15日提交的美国临时专利申请号61/793,997和2013年7月13日提交的美国临时专利申请号61/845,987的优先权,上述各个专利申请均为所有目的通过引用而整体并入本文。
技术介绍
多核苷酸的检测和定量对于分子生物学和医学应用如诊断学是重要的。遗传检测特别可用于许多诊断方法。例如,由稀有遗传改变(例如,序列变异体)或外遗传标记物的改变引起的病症,如癌症和部分或完全的非整倍性,可以用DNA序列信息进行检测或更准确地表征。遗传性疾病如癌症的早期检测和监测在疾病的成功治疗或管理中通常是有用的或需要的。一种方法可以包括监测来源于无细胞的核酸的样品,其为可在不同类型的体液中发现的多核苷酸群体。在一些情况下,可以基于检测遗传异常,如一个或多个核酸序列的拷贝数变异和/或序列变异的变化,或其它某些稀有遗传改变的发展,来表征或检测疾病。无细胞的DNA(“cfDNA”)几十年来已为本领域所知,并且可以包含与特定疾病相关的遗传异常。随着测序和操纵核酸的技术的改进,本领域中存在对使用无细胞的DNA来检测和监测疾病的改进方法和系统的需求。
技术实现思路
本公开内容提供了一种用于检测拷贝数变异的方法,该方法包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中该细胞外多核苷酸中的每一个任选地附接至独特条形码;b)过滤掉未能满足所设定的阈值的阅读值;c)将由步骤(a)获得的序列阅读值定位(mapping)至参考序列;d)对在所述参考序列的两个或更多个预定义区域中定位的阅读值进行定量/计数;e)通过下列步骤确定在一个或多个预定义区域中的拷贝数变异:(i)将预定义区域中的阅读值的数目相对于彼此进行归一化,和/或将预定义区域中的独特条形码的数目相对于彼此进行归一化;和(ii)将从步骤(i)中获得的归一化的数目与从对照样品获得的归一化的数目进行比较。本公开内容还提供了一种用于检测从受试者获得的无细胞的或基本无细胞的样品中的稀有突变的方法,该方法包括:a)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序阅读值;b)对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序阅读值;对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个生成多个测序阅读值;c)过滤掉未能满足所设定的阈值的阅读值;d)将从测序得到的序列阅读值定位至参考序列上;e)鉴别在各个可定位的碱基位置处与参考序列的变异体对准的被定位序列阅读值的亚组;f)对各个可定位的碱基位置,计算出(a)与参考序列相比包含变异体的被定位序列阅读值的数目与(b)各个可定位碱基位置的序列阅读值总数的比值;g)将各个可定位碱基位置的变异的比值或频率进行归一化并确定潜在的稀有变异体或突变;h)以及将具有潜在的稀有变异体或突变的各个区域的所得数目与从参考样品类似地得到的数目进行比较。另外,本公开内容还提供了一种用于表征受试者中的异常状况的异质性的方法,该方法包括生成受试者的细胞外多核苷酸的遗传谱(genetic profile),其中所述遗传谱包含由拷贝数变异和/或其它稀有突变(例如,遗传改变)分析得到的多个数据。在一些实施方案中,同时报告和定量在受试者中鉴别的各个稀有变异体的出现率(prevalence)/浓度。在其它实施方案中,报告关于受试者中稀有变异体的出现率/浓度的置信得分(confidence score)。在一些实施方案中,细胞外多核苷酸包含DNA。在其它实施方案中,细胞外多核苷酸包含RNA。多核苷酸可以是片段或在分离后被片段化。此外,本公开内容提供了用于循环核酸分离和提取的方法。在一些实施方案中,从身体样品分离细胞外多核苷酸,该身体样品可选自血液、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液。在一些实施方案中,本公开内容的方法还包括确定在所述身体样品中具有拷贝数变异或其它稀有遗传改变(例如,序列变异体)的序列的百分比的步骤。在一些实施方案中,通过计算所具有的多核苷酸的量高于或低于预定阈值的预定义区域的百分比,来确定在所述身体样品中具有拷贝数变异的序列的百分比。在一些实施方案中,体液从疑似具有异常状况的受试者抽取,该异常状况可选自突变、稀有突变、单核苷酸变异体、插入缺失、拷贝数变异、颠换、易位、倒位、缺失、非整倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化、核酸甲基化的异常变化、感染和癌症。在一些实施方案中,受试者可以是妊娠的女性,其中异常状况可以是选自单核苷酸变异体、插入缺失、拷贝数变异、颠换、易位、倒位、缺失、非整倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化、核酸甲基化的异常变化、感染和癌症的胎儿异常。在一些实施方案中,该方法可以包括在测序前将一个或多个条形码附接至细胞外多核苷酸或其片段,其中包含的条形码是独特的。在其它实施方案中,在测序前附接至细胞外多核苷酸或其片段的条形码不是独特的。在一些实施方案中,本公开内容的方法可以包括在测序前从受试者的基因组或转录组选择性地富集区域。在其它实施方案中,本公开内容的方法包括在测序前从受试者的基因组或转录组选择性地富集区域。在其它实施方案中,本公开内容的方法包括在测序前从受试者的基因组或转录组非选择性地富集区域。此外,本公开内容的方法包括在任何扩增或富集步骤前,将一个或多个条形码附接至细胞外多核苷酸或其片段。在一些实施方案中,所述条形码是多核苷酸,其可以进一步包含随机序列或固定的或半随机的一组寡核苷酸,该寡核苷酸与从选定区域测序的分子的多样性组合能够鉴别独特的分子并且为至少3、5、10、15、20、25、30、35、40、45或50聚物碱基对的长度。在一些实施方案中,可以扩增细胞外多核苷酸或其片段。在一些实施方案中本文档来自技高网...

【技术保护点】
一种用于检测拷贝数变异的方法,所述方法包括:a.对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所述细胞外多核苷酸中的每一个产生多个测序阅读值;b.过滤掉未能满足所设定的阈值的阅读值;c.在过滤掉阅读值后,将由步骤(a)获得的所述序列阅读值定位至参考序列;d.对在所述参考序列的两个或更多个预定义区域中定位的阅读值进行定量或计数;以及e.通过下列步骤确定在一个或多个所述预定义区域中的拷贝数变异:i.将所述预定义区域中的阅读值的数目相对于彼此进行归一化,和/或将所述预定义区域中的独特序列阅读值的数目相对于彼此进行归一化;ii.将从步骤(i)中获得的归一化的数目与从对照样品获得的归一化的数目进行比较。

【技术特征摘要】
【国外来华专利技术】2012.09.04 US 61/696,734;2012.09.21 US 61/704,400;1.一种用于检测拷贝数变异的方法,所述方法包括:
a.对来自受试者的身体样品的细胞外多核苷酸进行测序,其中
所述细胞外多核苷酸中的每一个产生多个测序阅读值;
b.过滤掉未能满足所设定的阈值的阅读值;
c.在过滤掉阅读值后,将由步骤(a)获得的所述序列阅读值
定位至参考序列;
d.对在所述参考序列的两个或更多个预定义区域中定位的阅
读值进行定量或计数;以及
e.通过下列步骤确定在一个或多个所述预定义区域中的拷贝
数变异:
i.将所述预定义区域中的阅读值的数目相对于彼此进行归一化,
和/或将所述预定义区域中的独特序列阅读值的数目相对于彼此进行
归一化;
ii.将从步骤(i)中获得的归一化的数目与从对照样品获得的
归一化的数目进行比较。
2.一种用于检测从受试者获得的无细胞的或基本无细胞的样品
中的稀有突变的方法,所述方法包括:
a.对来自受试者的身体样品的细胞外多核苷酸进行测序,其中
所述细胞外多核苷酸中的每一个生成多个测序阅读值;
b.如果未进行富集,则进行区域上的多重测序或全基因组测序;
c.过滤掉未能满足所设定的阈值的阅读值;
d.将从所述测序得到的序列阅读值定位至参考序列上;
e.鉴别在各个可定位的碱基位置处与所述参考序列的变异体
对准的被定位序列阅读值的亚组;
f.对各个可定位的碱基位置,计算出(a)与所述参考序列相比
包含变异体的被定位序列阅读值的数目与(b)各个可定位碱基位置
的序列阅读值总数的比值;
g.将各个可定位碱基位置的变异的所述比值或频率进行归一
化并确定潜在的稀有变异体或突变;以及
h.将具有潜在的稀有变异体或突变的各个区域的所得数目与
从参考样品类似地得到的数目进行比较。
3.一种表征受试者中的异常状况的异质性的方法,所述方法包
括生成所述受试者的细胞外多核苷酸的遗传谱,其中所述遗传谱包含
由拷贝数变异和稀有突变分析得到的多个数据。
4.根据权利要求1、2或3所述的方法,其中同时报告和定量在
所述受试者中鉴别的各个稀有变异体的出现率/浓度。
5.根据权利要求1、2或3所述的方法,其中报告关于所述受试
者中稀有变异体的出现率/浓度的置信得分。
6.根据权利要求1、2或3所述的方法,其中所述细胞外多核苷
酸包含DNA。
7.根据权利要求1、2或3所述的方法,其中所述细胞外多核苷
酸包含RNA。
8.根据权利要求1、2或3所述的方法,其进一步包括从所述身
体样品中分离细胞外多核苷酸。
9.根据权利要求1、2或3所述的方法,其中所述分离包括用于
循环核酸分离和提取的方法。
10.根据权利要求1、2或3所述的方法,其进一步包括对所述
分离的细胞外多核苷酸进行片段化。
11.根据权利要求8所述的方法,其中所述身体样品选自血液、
血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液。
12.根据权利要求1、2或3所述的方法,其进一步包括确定在
所述身体样品中具有拷贝数变异或稀有突变或变异体的序列的百分
比的步骤。
13.根据权利要求12所述的方法,其中所述确定包括计算所具
有的多核苷酸的量高于或低于预定阈值的预定义区域的百分比。
14.根据权利要求1、2或3所述的方法,其中所述受试者疑似

\t具有异常状况。
15.根据权利要求14所述的方法,其中所述异常状况选自突变、
稀有突变、插入缺失、拷贝数变异、颠换、易位、倒位、缺失、非整
倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、
基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损
伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化、
核酸甲基化的异常变化、感染和癌症。
16.根据权利要求1、2或3所述的方法,其中所述受试者是妊
娠的女性。
17.根据权利要求1或2所述的方法,其中所述拷贝数变异或稀
有突变或遗传变异体指示胎儿异常。
18.根据权利要求17所述的方法,其中所述胎儿异常选自突变、
稀有突变、插入缺失、拷贝数变异、颠换、易位、倒位、缺失、非整
倍性、部分非整倍性、多倍性、染色体不稳定性、染色体结构改变、
基因融合、染色体融合、基因截短、基因扩增、基因复制、染色体损
伤、DNA损伤、核酸化学修饰的异常变化、外遗传模式的异常变化、
核酸甲基化的异常变化、感染和癌症。
19.根据权利要求1、2或3所述的方法,其进一步包括在测序
前将一个或多个条形码附接至所述细胞外多核苷酸或其片段。
20.根据权利要求19所述的方法,其中在测序前附接至细胞外
多核苷酸或其片段的各个条形码是独特的。
21.根据权利要求19所述的方法,其中在测序前附接至细胞外
多核苷酸或其片段的各个条形码不是独特的。
22.根据权利要求1、2或3所述的方法,其进一步包括在测序
前从所述受试者的基因组或转录组选择性地富集区域。
23.根据权利要求1、2或3所述的方法,其进一步包括在测序
前从所述受试者的基因组或转录组非选择性地富集区域。
24.根据权利要求1、2或3所述的方法,其进一步包括在任何
扩增或富集步骤前,将一个或多个条形码附接至所述细胞外多核苷酸

\t或其片段。
25.根据权利要求19所述的方法,其中所述条形码是多核苷酸。
26.根据权利要求19所述的方法,其中所述条形码包含随机序
列。
27.根据权利要求19所述的方法,其中所述条形码包含固定的
或半随机的一组寡核苷酸,该寡核苷酸与从选定区域测序的分子的多
样性组合能够鉴别独特的分子。
28.根据权利要求19所述的方法,其中所述条形码包含长度至
少为3、5、10、15、20、25、30、35、40、45或50聚物碱基对的寡
核苷酸。
29.根据权利要求1、2或3所述的方法,其进一步包括扩增所
述细胞外多核苷酸或其片段。
30.根据权利要求29所述的方法,其中所述扩增包括全局扩增
或全基因组扩增。
31.根据权利要求1、2或3所述的方法,其中基于在所述序列
阅读值的开始(启动)和结束(终止)区域处的序列信息和所述序列
阅读值的长度来检测独特身份的序列阅读值。
32.根据权利要求31所述的方法,其中基于在所述序列阅读值
的开始(启动)和结束(终止)区域处的序列信息、所述序列阅读值
的长度和条形码的附接来检测独特身份的序列分子。
33.根据权利要求30所述的方法,其中所述扩增包括选择性扩
增。
34.根据权利要求33所述的方法,其中所述扩增包括非选择性
扩增。
35.根据权利要求1、2或3所述的方法,其中进行抑制扩增或
消减富集。
36.根据权利要求1、2或3所述的方法,其进一步包括在对阅
读值进行定量或计数前从进一步的分析中除去所述阅读值的亚组。
37.根据权利要求36所述的方法,其中所述除去包括过滤掉准

\t确度或质量得分小于阈值例如90%、99%、99.9%或99.99%和/或定位
得分小于阈值例如90%、99%、99.9%或99.99%的阅读值。
38.根据权利要求1、2或3所述的方法,其进一步包括过滤质
量得分小于所设定的阈值的阅读值。
39.根据权利要求1所述的方法,其中所述预定义区域在大小上
是均匀的或基本均匀的。
40.根据权利要求39所述的方法,其中所述预定义区域的大小
是至少约10kb、20kb、30kb、40kb、50kb、60kb、70kb、80kb、
90kb或100kb。
41.根据权利要求1、2或3所述的方法,其中分析至少50、100、
200、500、1000、2000、5000、10,000、20,000或50,000个区域。
42.根据权利要求1、2或3所述的方法,其中所述变异体发生
在选自基因融合、基因复制、基因缺失、基因易位、微卫星区域、基
因片段或其组合的基因组区域中。
43.根据权利要求1、2或3所述的方法,其中所述变异体发生
在选自基因、癌基因、肿瘤抑制基因、启动子、调节序列元件或其组
合的基因组区域中。
44.根据权利要求2所述的方法,其中所述变异体是1、2、3、4、
5、6、7、8、9、10、15或20个核苷酸长度的核苷酸变异体、单碱基
置换、小插入缺失、颠换、易位、倒位、缺失、截短或基因截短。
45.根据权利要求1、2或3所述的方法,其进一步包括使用所
述条形码或单个阅读值的独特性质来校正/归一化/调整所定位的阅读
值的量。
46.根据权利要求1或2所述的方法,其中通过对各个所述预定
义区域中的独特条形码进行计数并将这些数目在所测序的预定义区
域的至少一个亚组中进行归一化,来对所述阅读值进行计数。
47.根据权利要求1、2或3所述的方法,其中分析以连续的时
间间隔来自相同受试者的样品并将其与以前的样品结果进行比较。
48.根据权利要求45所述的方法,其中所述方法进一步包括扩

\t增所述附接有条形码的细胞外多核苷酸。
49.根据权利要求1、2或3所述的方法,其进一步包括确定部
分拷贝数变异频率、确定杂合性的丢失、进行基因表达分析、进行外
遗传分析和/或进行过度甲基化分析。
50.一种方法,该方法包括:使用多重测序在从受试者获得的无
细胞或基本无细胞的样品中确定拷贝数变异或进行稀有突变分析。
51.根据权利要求50所述的方法,其中所述多重测序包括进行
超过10,000个测序反应。
52.根据权利要求50所述的方法,其中所述多重测序包括同时
对至少10,000个不同的阅读值进行测序。
53.根据权利要求50所述的方法,其中所述多重测序包括在整
个基因组上对至少10,000个不同的阅读值进行数据分析。
54.根据权利要求1或2所述的方法,其中使用隐马尔可夫、动
态编程、支持向量机、贝叶斯或概率建模、网格解码、维特比解码、
期望最大化、卡尔曼过滤或神经网络方法中的一个或多个进行所述归
一化和检测。
55.根据权利要求1、2或3所述的方法,其进一步包括基于所
发现的变异体对所述受试者监测疾病进展、监测残留疾病、监测疗法、
诊断状况、状况预后或者选择疗法。
56.根据权利要求55所述的方法,其中基于最近的样品分析来
修改疗法。
57.根据权利要求1、2或3所述的方法,其中推断肿瘤、感染
或其它组织异常的遗传谱。
58.根据权利要求1、2或3所述的方法,其中监测肿瘤、感染
或其它组织异常的生长、缓解或演变。
59.根据权利要求1、2或3所述的方法,其中在单一情况下或
随时间推移分析和监测与所述受试者的免疫系统相关的序列。
60.根据权利要求1、2或3所述的方法,其中通过成像测试(例
如,CT、PET-CT、MRI、X射线、超声波)追踪变异体的鉴别,以

\t便定位疑似引起所鉴别的变异体的组织异常。
61.根据权利要求1、2或3所述的方法,其中所述分析进一步
包括使用从来自相同患者的组织或肿瘤活检获得的遗传数据。
62.根据权利要求1、2或3所述的方法,其中推断肿瘤、感染
或其它组织异常的系统发生学。
63.根据权利要求1或2所述的方法,其中所述方法进一步包括
对低置信区域进行基于群体的非判定和鉴别。
64.根据权利要求1或2所述的方法,其中获得序列覆盖度的测
量数据包括测量基因组的每个位置处的序列覆盖深度。
65.根据权利要求64所述的方法,其中针对序列覆盖偏倚校正
测量数据包括计算窗口平均的覆盖度。
66.根据权利要求64所述的方法,其中针对序列覆盖偏倚校正
测量数据包括进行调整以应对在文库构建和测序过程中的GC偏倚。
67.根据权利要求64所述的方法,其中针对序列覆盖偏倚校正
测量数据包括基于与个体定位相关联的附加加权因子进行调整,以补
偿偏倚。
68.根据权利要求1、2或3所述的方法,其中细胞外多核苷酸
源自病变细胞来源。
69.根据权利要求1、2或3所述的方法,其中细胞外多核苷酸
源自健康细胞来源。
70.一种包含计算机可读介质的系统,该计算机可读介质用于执
行以下步骤:选择基因组中的预定义区域;对所述预定义区域中的序
列阅读值的数目进行计数;对所述预定义区域上的序列阅读值的数目
进行归一化;以及确定所述预定义区域中的拷贝数变异的百分比。
71.根据权利要求70所述的方法,其中分析整个基因组或基因
组的至少85%。
72.根据权利要求70所述的方法,其中所述计算机可读介质将
关于血浆或血清中的癌症DNA或RNA百分比的数据提供给最终用户。
73.根据权利要求1所述的方法,其中由于样品的异质性,所鉴

\t别的拷贝数变异体是分数(即,非整数水平)。
74.根据权利要求1所述的方法,由此进行选定的区域的富集。
75.根据权利要求1所述的方法,由此基于权利要求1、64、65、
66和67所述的方法同时提取拷贝数变异信息。
76.根据权利要求1或2所述的方法,其与瓶颈化多核苷酸以限
制样品中的多核苷酸的起始初始拷贝数或多样性的初始步骤一起使
用。
77.一种用于在从受试者获得的无细胞或基本无细胞的样品中检
测稀有突变的方法,该方法包括:
a.对来自受试者的身体样品的细胞外多核苷酸进行测序,其中所
述细胞外多核苷酸中的每一个产生多个测序阅读值;
b.过滤掉未能满足所设定的质量阈值的阅读值;
c.将从所述测序得到的序列阅读值定位至参考序列上;
d.鉴别在各个可定位的碱基位置处与所述参考序列的变异体对
准的被定位序列阅读值的亚组;
e.对于各个可定位的碱基位置,计算出(a)与所述参考序列相
比包含变异体的被定位序列阅读值的数目与(b)各个可定位碱基位
置的序列阅读值总数的比值;
f.将各个可定位碱基位置的变异的比值或频率进行归一化,并确
定潜在的稀有变异体或其它遗传改变;以及
g.将具有潜在的稀有变异体或突变的各个区域的所得数目与从
参考样品类似地得到的数目进行比较。
78.一种方法,该方法包括:
a.提供至少一组标记的亲本多核苷酸,并且对于各组标记的亲本
多核苷酸;
b.扩增该组中的标记的亲本多核苷酸,以产生相应的一组扩增的
子代多核苷酸;
c.对该组扩增的子代多核苷酸的亚组(包括真亚组)进行测序,
以产生一组测序阅读值;以及
d.使该组测序阅读值分解,以产生一组共有序列,各个共有序列
对应于该组标记的亲本多核苷酸之间的独特多核苷酸。
79.根据权利要求78所述的方法,其中一组中的各个多核苷酸
可定位至参考序列。
80.根据权利要求78所述的方法,其包括提供多组标记的亲本
多核苷酸,其中各组可定位至所述参考序列中不同的可定位位置。
81.根据权利要求78所述的方法,其进一步包括:e.分开地或
组合地针对每组标记的亲本分子对该组共有序列进行分析。
82.根据权利要求78所述的方法,其进一步包括将初始起始遗
传材料转换成标记的亲本多核苷酸。
83.根据权利要求82所述的方法,其中所述初始起始遗传材料
包含不超过100ng的多核苷酸。
84.根据权利要求82所述的方法,其包括在转换前瓶颈化所述
初始起始遗传材料。
85.根据权利要求82所述的方法,其包括以至少10%、至少20%、
至少30%、至少40%、至少50%、至少60%、至少80%或至少90%
的转换效率将所述初始起始遗传材料转换成标记的亲本多核苷酸。
86.根据权利要求82所述的方法,其中转换包括平端连接、粘
端连接、分子倒位探针、PCR、基于连接的PCR、单链连接和单链环
化中的任何方法。
87.根据权利要求82所述的方法,其中所述初始起始遗传材料
是无细胞的核酸。
88.根据权利要求79所述的方法,其中多个所述组定位至来自
相同基因组的参考序列中的不同可定位位置。
89.根据权利要求78所述的方法,其中所述组中的各个标记的
亲本多核苷酸是独特地标记的。
90.根据权利要求78所述的方法,其中各组亲本多核苷酸可定
位至参考序列中的位置,并且各组中的多核苷酸不是独特地标记的。
91.根据权利要求78所述的方法,其中共有序列的生成基于来

\t自标签的信息和/或以下至少一个:(i)在所述序列阅读值的开始(启
动)区域的序列信息、(ii)在所述序列阅读值的结束(终止)区域
的序列信息和(iii)所述序列阅读值的长度。
92.根据权利要求78所述的方法,其包括对该组扩增的子代多
核苷酸的亚组进行测序,该测序足以对至少一个子代产生序列阅读值,
该子代来自该组标记的亲本多核苷酸中的独特多核苷酸的至少20%、
至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、
至少90%、至少95%、至少98%、至少99%、至少99.9%或至少99.99%
中的每一个。
93.根据权利要求92所述的方法,其中所述至少一个子代是多
个子代,例如,至少2个、至少5个或至少10个子代。
94.根据权利要求78所述的方法,其中该组序列阅读值中的序
列阅读值的数目大于该组标记的亲本多核苷酸中的独特标记的亲本
多核苷酸的数目。
95.根据权利要求78所述的方法,其中被测序的该组扩增的子
代多核苷酸的亚组具有足够的大小,以使得以与所用测序平台的每碱
基测序错误率百分比相同的百分比在该组标记的亲本多核苷酸中呈
现的任何核苷酸序列有至少50%、至少60%、至少70%、至少80%、
至少90%、至少95%、至少98%、至少99%、至少99.9%或至少99.99%
的机会在该组共有序列之间呈现。
96.根据权利要求78所述的方法,其包括通过以下步骤,针对
定位至参考序列中一个或多个选定的可定位位置的多核苷酸,富集该
组扩增的子代多核苷酸:(i)来自已转换成标记的亲本多核苷酸的初
始起始遗传材料的序列的选择性扩增;(ii)标记的亲本多核苷酸的
选择性扩增;(iii)扩增的子代多核苷酸的选择性序列捕获;或(iv)
初始起始遗传材料的选择性序列捕获。
97.根据权利要求81所述的方法,其中分析包括将从一组共有
序列获得的度量(例如,数目)相对于从来自对照样品的一组共有序
列获得的度量进行归一化。
98.根据权利要求81所述的方法,其中分析包括检测突变、稀
有突变、单核苷酸变异体、插入缺失、拷贝数变异、颠换、易位、倒
位、缺失、非整倍性、部分非整倍性、多倍性、染色体不稳定性、染
色体结构改变、基因融合、染色体融合、基因截短、基因扩增、基因
复制、染色体损伤、DNA损伤、核酸化学修饰的异常变化、外遗传
模式的异常变化、核酸甲基化的异常变化、感染或癌症。
99.根据权利要求78所述的方法,其中所述多核苷酸包含DNA、
RNA、这两者的组合或DNA加RNA衍生的cDNA。
100.根据权利要求82所述的方法,其中针对或基于碱基对的多
核苷酸长度从多核苷酸的初始组或从扩增的多核苷酸中选择或富集
多核苷酸的某个亚组。
101.根据权利要求82所述的方法,其中分析进一步包括检测和
监测个体内的异常或疾病,例如,感染和/或癌症。
102.根据权利要求101所述的方法,其与免疫组库谱分析组合
进行。
103.根据权利要求78所述的方法,其中所述多核苷酸从选自血
液、血浆、血清、尿液、唾液、粘膜分泌物、痰、粪便和泪液的样品
中提取。
104.根据权利要求78所述的方法,其中分解包括检测和/或校正
在标记的亲本多核苷酸或扩增的子代多核苷酸的有义或反义链中存
在的错误、切口或损伤。
105.一种方法,其包括以至少5%、至少1%、至少0.5%、至少
0.1%或至少0.05%的灵敏度检测非独特标记的初始起始遗传材料中的
遗传变异。
106.根据权利要求105所述的方法,其中所述初始起始遗传材
料以小于100ng的核酸的量来提供,该遗传变异是拷贝数/杂合性变
异,并且检测在亚染色体分辨率下进行;例如,至少100兆碱基分辨
率、至少10兆碱基分辨率、至少1兆碱基分辨率、至少100千碱基
分辨率、至少10千碱基分辨率或至少1千碱基分辨率。
107.根据权利要求81所述的方法,其包括提供多组标记的亲本
多核苷酸,其中各组可定位至参考序列中不同的可定位位置。
108.根据权利要求107所述的方法,其中所述参考序列中的可
定位位置是肿瘤标志物的基因座,并且分析包括检测该组共有序列中
的肿瘤标志物。
109.根据权利要求108所述的方法,其中所述肿瘤标志物以小
于在扩增步骤中引入的错误率的频率存在于该组共有序列中。
110.根据权利要求107所述的方法,其中所述至少一组是多个
组,并且所述参考序列的可定位位置包含该参考序列中的多个可定位
位置,其中各个可定位位置是肿瘤标志物的基因座。
111.根据权利要求107所述的方法,其中分析包括检测在至少
两组亲本多核苷酸间的共有序列的拷贝数变异。
112.根据权利要求107所述的方法,其中分析包括检测与参考
序列相比序列变异的存在。
113.根据权利要求107所述的方法,其中分析包括检测与参考
序列相比序列变异的存在并检测在至少两组亲本多核苷酸间的共有
序列的拷贝数变异。
114.根据权利要求78所述的方法,其中分解包括:
i.将从扩增的子代多核苷酸测序的序列阅读值分组成家族,各个
家族从相同的标记的亲本多核苷酸扩增;以及
ii.基于家族中的序列阅读值确定共有序列。
115.一种包含计算机可读介质的系统,该计算机可读介质用于
执行以下步骤:
a.接受至少一组标记的亲本多核苷酸,并且对于各组标记的亲本
多核苷酸;
b.扩增该组中的标记的亲本多核苷酸,以产生相应的一组扩增的
子代多核苷酸;
c.对该组扩增的子代多核苷酸的亚组(包括真亚组)进行测序,
以产生一组测序阅读值;以及
d.分解该组测序阅读值,以生成一组共有序列,各个共有序列对
应于该组标记的亲本多核苷酸间的独特多核苷酸,以及任选地
e.针对各组标记的亲本分子对该组共有序列进行分析。
116.一种方法,其包括检测个体中的遗传改变的存在与否存在
与否或遗传变异的量,其中所述检测在无细胞核酸的测序的辅助下进
行,其中对个体的基因组的至少10%进行测序。
117.一种方法,其包括检测个体中的遗传改变的存在与否存在
与否或遗传变异的量,其中所述检测在无细胞核酸的测序的辅助下进
行,其中对个体的基因组的至少20%进行测序。
118.一种方法,其包括检测个体中的遗传改变的存在与否存在
与否或遗传变异的量,其中所述检测在无细胞核酸的测序的辅助下进
行,其中对个体的基因组的至少30%进行测序。
119.一种方法,其包括检测个体中的遗传改变的存在与否存在
与否或遗传变异的量,其中所述检测在无细胞核酸的测序的辅助下进
行,其中对个体的基因组的至少40%进行测序。
120.一种方法,其包括检测个体中的遗传改变的存在与否存在
...

【专利技术属性】
技术研发人员:阿米尔阿里·塔拉萨兹埃尔米·埃尔图凯
申请(专利权)人:夸登特健康公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1