当前位置: 首页 > 专利查询>康奈尔大学专利>正文

通过全基因组整合进行循环肿瘤DNA的超灵敏检测制造技术

技术编号:27946787 阅读:77 留言:0更新日期:2021-04-02 14:30
本公开涉及用于诊断患者中的肿瘤疾病的系统、软件和方法。

【技术实现步骤摘要】
【国外来华专利技术】通过全基因组整合进行循环肿瘤DNA的超灵敏检测相关申请的交叉引用本申请要求于2018年2月27日提交的美国临时申请号62/636,135的权益,其全部内容通过引用合并于此。
本公开的实施方案一般涉及医学诊断领域。具体地,本公开的实施方案涉及用于肿瘤检测和诊断的组合物、方法和系统。
技术介绍
医学文献中充分记载了癌症(如肺、乳腺、前列腺、肝和脑的实体瘤)对人类健康造成的巨大负担。大多数受试者被诊断患有晚期肿瘤疾病,所述晚期肿瘤疾病与令人沮丧的结果相关。最近,发现计算机断层扫描(CT)改善了早期检测,并被美国工作组用于筛查高危人群。然而,该方法受到高假阳性率的限制,导致昂贵且潜在危险的后续评估。一种用于癌症诊断的方法是分析肿瘤样品的遗传线索或标记。癌症基因组获得了驱动其增殖能力的体细胞突变(Lawrence等人,Nature,505(7484):495-501,2014)。癌症基因组中的突变还提供了关于在每种癌症中活跃的进化史和突变过程的关键信息(Martincorena等人,Cell,171(5):1029-1041.e21,2017;Alexandrov等人,Nature,500(7463):415-421,2013)。患者活检中的癌症突变调用已成为评估患者结果和治疗提名(therapeuticnomination)中的关键步骤。鉴定液体活检样品中的癌症驱动突变,例如无细胞循环DNA(cfDNA),已经被建议作为早期癌症筛查的转化平台。用于分析诸如DNA中的体细胞突变(例如单核苷酸变体(SNV))的基因组标记的统计学方法需要在任何基因组位置对该体细胞变体进行多次独立观察(支持读数),以区分真实突变与测序错误。用于区分真实突变与测序错误的一种技术是增加测序的深度,只要肿瘤样品含有高比例的肿瘤细胞,该技术就很有用。当样品中的肿瘤细胞含量下降时,例如由于样品中存在诸如免疫细胞的正常细胞,多次读数不再支持每种体细胞变体,从而排除了这些突变调用器(mutationcaller)的使用。例如MUTECT是当前的最新低等位基因频率体细胞突变调用器。MUTECT的核心是将SNV置于两个贝叶斯分类器中,一个假设SNV是由随机噪声产生的,另一个假设该位点包含真实的变体。然后,它基于来自两个模型的对数似然比来过滤SNV。这与cfDNA设定基本不同。在突变等位基因频率降至0.05且肿瘤样品测序深度降至10X时的基准设定中,MUTECT的灵敏度降低到低于0.1(Cibulskis等人,NatureBiotechnology,31(3),213,203)。尽管MUTECT目前是低频环境中最先进的体细胞突变调用器,但它仍无法鉴定肿瘤分数中的体细胞突变,如cfDNA中观察到的。MUTECT和其它突变调用器的根本限制是当输入材料受到限制时(例如在早期癌症疾病背景中)临床灵敏度低于可接受的水平。如此低的cfDNA量只能翻译成数百到数千的基因组当量。因此,覆盖样品中存在的每个位点的有限数量的物理片段(例如,6ngcfDNA中1000个基因组当量)可能会使超深度测序(例如100,000X)失效。即使采用超深度测序和先进的分子错误抑制,有限的输入材料也会使低于0.1-1%的肿瘤分数(TF)频率具有检测极限。Abbosh等人举例说明了这种限制(Nature,545(7655):446-451,2017),其应用先进的测序方法,包括技术上具有挑战性的肺腺癌患者特异性靶向深度测序,以在42,000X的中值测序深度鉴定约18个突变。然而,cfDNA缺乏很可能导致仅19%的早期受试者在cfDNA中检测出癌症,甚至在研究组中包括更晚期的III期肿瘤。此外,所有这些鉴定为阳性的患者均具有可通过CT扫描检测到的病变。这些数据表明,在疾病早期,就包容性和/或精度而言,即使是超深度测序目前也差于成像技术。需要用于鉴定低丰度疾病标记的改进方法和系统,所述标记为例如cfDNA中的体细胞突变(包括不同的受试者特异性签名),其指示肿瘤疾病。另外,需要利用可以在肿瘤的早期诊断中使用的这种高质量标记的系统和方法,从而为临床医生提供更好的疾病管理和/或治疗干预的选择,并且还可以大大改善疾病的结果(例如,提高生存率和/或生活质量)。
技术实现思路
本文提供了用于筛查受试者的癌症并且使用从筛查中获得的信息进行早期检测和疾病分层的程序、系统和方法。在一些实施方案中,本公开的程序、系统和方法允许用户例如临床医生及早诊断癌症。在一些方面,本公开提供了一种分类器,其被训练以区分系统性错误和由癌症(例如烟草诱导的肺癌)引起的体细胞突变。利用癌症突变和测序错误都是系统性并通过可以学习并用于有效信噪比区分的独特签名来控制的事实,分类器整合了此类知识,以提高癌症诊断和/或检测的准确性。例如,在基因组上下文中,癌症签名可包括引起癌症相关诱变的碱基置换。此类基因组签名在暴露于烟草和紫外线下引起的癌症中尤其独特,所述癌症包括与失调的DNA检查点和/或修复酶活性(例如BRCA(BRCA1或BRCA2)、p53、APOBEC1等)相关的癌症。本公开内容还涉及能够指示通过测序检测到的变体不是真正的体细胞突变而是测序或映射技术假象的多个指标。在这种情况下,先前的研究表明测序错误不是随机的,并且可能与DNA序列上下文和测序技术的相关技术因素有关。测序的保真度还受到每个测序读数(sequencing-read)长度的限制,错误率随着读数长度的增加而增加。当将读数映射(map)到参考基因组时可能会产生错误。由于基因组具有可变区、基序和可重复元素,这一映射过程在计算上是密集的,并且很复杂。短核苷酸读数可能会映射到多于一个位置或根本不会映射。可以使用本公开的系统和方法来纠正用于测序/映射基因组数据的现有方法的这些限制。通过分析多种因素,本公开的指标能够从错误中调用真正的突变,这些因素包括:(i)低碱基质量;(ii)低映射质量;(iii)读数的估计片段大小(RP);(iv)读数的估计等位基因分数(VAF);(v)序列上下文;(vi)丰度;(vii)测序深度;和/或(viii)测序错误。本系统和方法特别适合于检测可预测癌症的低丰度标记。本公开的专利技术人已经认识到,测序宽度不受输入材料的丰度的限制,可以取代依赖深度测序的方法。由于宽度测序较低依赖于输入材料的丰度,因此可用于提高检测的准确性和灵敏度。从统计学的角度来看,专利技术人首先证明了测序宽度(例如,10,000个突变的10X测序)等同于深度(单个突变的100,000X测序),并且可以在少至1ng的cfDNA上进行。因此,本公开的分析方法整合了全基因组突变信息,用于敏感分析包含cfDNA的样品,从而容易且无创地检测和/或精确诊断肿瘤(例如,烟草诱发的癌症)。在这种情况下,血浆体细胞突变调用的模拟测试显示了本方法相对于现有技术的强度和准确性,其中所述血浆体细胞突变调用的模拟测试使用来自肿瘤读数的可变分数范围为1%至0.001%(1/10,000)的肺患者的肿瘤和正常全基因组测序数据的合成混合物。通过以下步骤进一步对该技术本文档来自技高网
...

【技术保护点】
1.一种对受试者进行癌症遗传筛查的方法,包括:/n(A)接收来自受试者的生物样品的与多个遗传标记相关的受试者特异性全基因组读数概要,所述生物样品包括血浆样品,其中所述读数概要各自包含单个碱基对长度的读数;/n(B)从读数概要中过滤人工位点,其中所述过滤包括(a)从读数概要中去除在参考健康样品队列上产生的重复位点;和/或(b)鉴定生物样品中的种系突变和/或将肿瘤样品与正常细胞样品的外周血单核细胞之间的共享突变鉴定为种系突变,并从读数概要中去除所述种系突变;/n(C)使用至少一种错误抑制方案从读数概要中过滤噪声,以产生全基因组读数概要的经过滤的读数集,其中所述至少一种错误抑制方案包括(a)计算所述概要中任何单个核苷酸变异是人工突变的概率,并去除所述突变,其中所述概率是作为选自包括以下各项的组的特征的函数来计算的:映射质量(MQ)、变体碱基质量(MBQ)、读数中的位置(PIR)、平均读数碱基质量(MRBQ)及其组合;和/或(b)使用由聚合酶链反应或测序处理产生的相同DNA片段的独立重复之间的不一致测试,和/或重复一致性来去除人工突变,其中当给定重复家族的大多数中缺乏一致性时,鉴定并去除人工突变;/n(D)基于与预定诱变过程相关的特定突变签名的比较,使用经过滤的读数集来编译受试者特异性签名;/n(E)基于癌症相关突变签名暴露值与背景突变签名队列的比较,通过受试者特异性签名对受试者的生物样品包括癌症相关突变签名的置信度估计进行统计学量化;和/n(F)如果受试者的生物样品中包含癌症相关突变签名的置信度估计超过给定阈值,则对受试者进行癌症筛查。/n...

【技术特征摘要】
【国外来华专利技术】20180227 US 62/636,1351.一种对受试者进行癌症遗传筛查的方法,包括:
(A)接收来自受试者的生物样品的与多个遗传标记相关的受试者特异性全基因组读数概要,所述生物样品包括血浆样品,其中所述读数概要各自包含单个碱基对长度的读数;
(B)从读数概要中过滤人工位点,其中所述过滤包括(a)从读数概要中去除在参考健康样品队列上产生的重复位点;和/或(b)鉴定生物样品中的种系突变和/或将肿瘤样品与正常细胞样品的外周血单核细胞之间的共享突变鉴定为种系突变,并从读数概要中去除所述种系突变;
(C)使用至少一种错误抑制方案从读数概要中过滤噪声,以产生全基因组读数概要的经过滤的读数集,其中所述至少一种错误抑制方案包括(a)计算所述概要中任何单个核苷酸变异是人工突变的概率,并去除所述突变,其中所述概率是作为选自包括以下各项的组的特征的函数来计算的:映射质量(MQ)、变体碱基质量(MBQ)、读数中的位置(PIR)、平均读数碱基质量(MRBQ)及其组合;和/或(b)使用由聚合酶链反应或测序处理产生的相同DNA片段的独立重复之间的不一致测试,和/或重复一致性来去除人工突变,其中当给定重复家族的大多数中缺乏一致性时,鉴定并去除人工突变;
(D)基于与预定诱变过程相关的特定突变签名的比较,使用经过滤的读数集来编译受试者特异性签名;
(E)基于癌症相关突变签名暴露值与背景突变签名队列的比较,通过受试者特异性签名对受试者的生物样品包括癌症相关突变签名的置信度估计进行统计学量化;和
(F)如果受试者的生物样品中包含癌症相关突变签名的置信度估计超过给定阈值,则对受试者进行癌症筛查。


2.一种对受试者进行癌症遗传筛查的方法,包括:
(A)接收来自受试者的生物样品的与多个遗传标记相关的受试者特异性全基因组读数概要,所述生物样品包括血浆样品,其中所述读数概要各自包含拷贝数变异(CNV))或结构变异(SV);
(B)将读数概要分成多个窗口;
(C)计算每个窗口的特征集合,这些特征包括每个窗口的中值深度覆盖度和每个窗口的代表性片段大小,以及任选的拆分读数;
(D)从读数概要中过滤人工位点,其中所述过滤包括从读数概要中去除在参考健康样品队列上产生的重复位点;
(E)归一化读数概要,以产生全基因组读数概要的经过滤的读数集;
(F)使用经过滤的读数集通过以下方式计算估计的肿瘤分数:(i)通过计算每个窗口的特征集合之间的线性关系,并使用回归模型将计算的关系转换为估计的肿瘤分数,和/或(ii)在一个或更多个整合数学模型的基础上,作为受试者特异性全基因组读数概要中计算的每个窗口的特征集合的函数;和
(G)如果估计的肿瘤分数超过经验阈值,则对受试者进行癌症筛查。


3.一种用于对受试者进行癌症遗传筛查的系统,包括:
分析单元,该分析单元包括:
预过滤器引擎,该预过滤器引擎被配置和布置为接收来自受试者的生物样品的与多个遗传标记相关的受试者特异性全基因组读数概要,该生物样品包括血浆样品,其中所述读数概要各自包括单个碱基对长度的读数;从读数概要中过滤出人工位点,其中所述过滤包括从读数概要中去除在参考健康样品队列上产生的重复位点;和/或鉴定生物样品中的种系突变和/或将肿瘤样品与正常细胞样品的外周血单核细胞之间的共享突变鉴定为种系突变,并从读数概要中去除所述种系突变;
校正引擎,所述校正引擎被配置和布置为使用至少一个错误抑制方案来从读数概要中过滤噪声,以产生全基因组读数概要的经过滤的读数集,其中所述至少一个错误抑制方案包括:(a)计算所述概要中任何单个核苷酸变异是人工突变的概率,并去除所述突变,其中所述概率是作为从包括以下各项的组中选择的特征的函数来计算的:映射质量(MQ)、变异碱基质量(MBQ)、读数中的位置(PIR)、中值读数碱基质量(MRBQ)及其组合;和/或(b)使用聚合酶链反应或测序处理产生的相同DNA片段的独立重复之间的不一致测试,和/或重复一致性来去除人工突变,其中给定重复家族的大多数之间缺乏一致性时鉴定和去除人工突变;以及
计算单元,所述计算单元被配置和布置为基于与预定诱变过程相关的特定突变签名的比较,使用经过滤的读数集来编译受试者特异性签名;基于对癌症相关突变签名暴露值与背景突变签名队列的比较,通过受试者特异性签名对受试者的生物样品包括癌症相关突变签名的置信度估计进行统计学量化;如果对受试者的生物样品包含癌症相关突变签名的置信度估计超过给定阈值,则对受试者进行癌症筛查。


4.一种用于在有需要的受试者中检测残留疾病的系统,包括:
分析单元,所述分析单元包括
分箱引擎,所述分箱引擎被配置和布置为接收来自受试者的生物样品的与多个遗传标记相关的受试者特异性全基因组读数概要,所述生物样品包括血浆样品,其中所述读数概要各自包括拷贝数变异(CNV);将所述读数概要划分为多个窗口;和计算每个窗口的特征集合,这些特征包括每个窗口的中值深度覆盖度和每个窗口的代表性片段大小;
预过滤器引擎,所述预过滤器引擎被配置和布置为从读数概要中过滤出人工位点,其中所述过滤包括从读数概要中去除在参考健康样品队列上产生的重复位点;和
归一化引擎,所述归一化引擎被配置和布置为归一化读数概要,以产生全基因组读数概要的经过滤的读数集;
以及计算单元,所述计算单元被配置和布置为使用经过滤的读数集通过以下...

【专利技术属性】
技术研发人员:丹·阿维·兰道阿萨夫·兹维兰史蒂文·柯登伊尔
申请(专利权)人:康奈尔大学纽约基因组中心
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1