用于区分体细胞基因组序列与种系基因组序列的方法和系统技术方案

技术编号:36594381 阅读:18 留言:0更新日期:2023-02-04 18:04
本文描述了用于区分体细胞变体与种系变体的方法,以及用于实现此类方法的设备。在所述方法的某些实施方式中,所述方法可以包括:鉴定患者样品中在基因组基因座处的感兴趣基因组序列;鉴定针对所述感兴趣序列的一个或多个代理基因组序列;将所述感兴趣序列的观察到的频率与所述一个或多个代理基因组序列的观察到的频率的中心性量度进行比较;以及基于所述比较,将所述感兴趣基因组序列表征为种系或体细胞。体细胞。体细胞。

【技术实现步骤摘要】
【国外来华专利技术】用于区分体细胞基因组序列与种系基因组序列的方法和系统
[0001]相关专利申请的交叉引用
[0002]本申请要求2020年6月5日提交的美国临时专利申请号63/035,572和2020年6月19日提交的美国临时专利申请号63/041,437的权益,这些临时申请以全文引用的方式并入本文。


[0003]本公开涉及用于区分体细胞基因组序列与种系基因组序列的系统和方法。

技术介绍

[0004]种系基因组序列是指生物体从其亲本继承的那些序列。特别地,如果生物体的亲本中的一者或两者都具有某些基因组突变(或如果该生物体在其非常早期的发育中经历了某些突变),那么这些突变可能是该生物体的种系,并将传递给该生物体的后代(如果有的话)。
[0005]相比之下,体细胞基因组序列是那些不会从亲本传递给子代的序列。例如,生物体可能由于外部因素(例如,污染、辐射、饮食、吸烟等)而发生基因组突变,其中这些基因组突变仅限于某些组织、流体或其他解剖材料。在一些情况下,这些突变会导致不期望的医学状况,包括但不限于癌症。
[0006]精准医学是这样的领域,其中用针对患者的个体特征或其状况的疗法来治疗该患者。对于许多患者(包括癌症患者),这可能包括:确定关于患者的“正常”基因组状态以及患者的“异常”组织、流体或其他解剖材料的基因组状态的基因组信息。该信息可以源自来自患者的样品,诸如肿瘤活检、抽血或具有正常和异常组织、流体或其他解剖材料的一些其他类型的样品。
[0007]可以测定这些样品以(至少部分地)确定其中所含材料的基因组序列。然而,鉴定特定基因组序列是否来自患者的正常解剖材料或其是否来自异常解剖材料有时是具有挑战性的;即,确实特定基因组序列是种系或体细胞有时是具有挑战性的。
[0008]了解在癌症患者的DNA中观察到的遗传变体是种系起源还是体细胞起源在临床实践和癌症研究两者中是至关重要的。可以例如通过对来自同一患者的匹配的肿瘤和正常组织进行测序来进行体细胞/种系区分。存在于肿瘤中但不存在于正常组织中的变体被分类为体细胞,而同时存在于两者中的变体被分类为种系。然而,这种双样品方法受到成本和标本可用性的限制。通常在临床实践中没有获得匹配的正常标本。例如,在组织活检的情况下,收集包含肿瘤及其邻近正常组织两者的单个标本。因此,需要开发能够可靠地将检测到的变体在起源上分类为体细胞或种系的方法。

技术实现思路

[0009]本文描述了用于区分体细胞基因组序列与种系基因组序列的方法、设备和计算机可读介质。
[0010]本文公开了将感兴趣基因组序列鉴定为种系或体细胞的方法,该方法包括:提供从来自受试者的样品获得的多个核酸分子,其中该多个核酸分子包括肿瘤核酸分子和非肿瘤核酸分子的混合物;任选地,将一个或多个衔接子连接到来自该多个核酸分子的一个或多个核酸分子上;扩增来自该多个核酸分子的核酸分子;从所扩增的核酸分子捕获核酸分子,其中所捕获的核酸分子是通过与一个或多个诱饵分子杂交而从扩增的核酸分子捕获的;通过测序仪对该所捕获的核酸分子进行测序,以获得对应于一个或多个基因组基因座的多个序列读段;通过一个或多个处理器在来自该一个或多个基因组基因座的基因组基因座处选择感兴趣基因组序列;通过该一个或多个处理器,选择针对该感兴趣基因组序列的一个或多个代理基因组序列;通过该一个或多个处理器,使用该感兴趣基因组序列的观察到的等位基因频率和指示该一个或多个代理基因组序列的观察到的等位基因频率的汇总统计量或分布来确定等位基因频率距离;以及通过该一个或多个处理器,使用该等位基因频率距离来将该感兴趣基因组序列鉴定为种系或体细胞。
[0011]在一些实施例中,受试者为癌症患者。在一些实施例中,样品包括组织活检样品、液体活检样品、循环肿瘤细胞(CTC)样品、无细胞DNA(cfDNA)样品或正常对照。在一些实施例中,样品为液体活检样品并且包括血液、血浆、脑脊髓液、痰、粪便、尿液或唾液。在一些实施例中,肿瘤核酸分子源自异质组织活检样品的肿瘤部分,并且非肿瘤核酸分子源自异质组织活检样品的正常部分。在一些实施例中,肿瘤核酸分子源自无细胞DNA样品的循环肿瘤DNA(ctDNA)分数,并且非肿瘤核酸分子源自无细胞DNA样品的非肿瘤分数。在一些实施例中,一个或多个衔接子包括扩增引物或测序衔接子。在一些实施例中,一个或多个诱饵分子包括一个或多个核酸分子,每个核酸分子包括与所捕获的核酸分子的区域互补的区域。在一些实施例中,扩增核酸分子包括执行聚合酶链式反应(PCR)或等温扩增技术。在一些实施例中,测序包括使用下一代测序(NGS)技术。在一些实施例中,测序仪包括下一代测序仪。在一些实施例中,一个或多个代理基因组序列位于受试者的基因组序列的限定片段内,并且所选择的感兴趣基因组序列位于同一限定片段内。在一些实施例中,基于每个片段内的拷贝数均匀性将受试者的基因组序列分割为多个片段。在一些实施例中,汇总统计量是平均等位基因频率或中位等位基因频率。在一些实施例中,等位基因频率距离是使用感兴趣基因组序列的观察到的等位基因频率和指示多个代理基因组序列的观察到的频率的分布来确定的,并且其中基于感兴趣基因组序列的观察到的等位基因频率拟合或不拟合在分布内的概率,将感兴趣基因组序列鉴定为种系或体细胞。
[0012]在一些实施例中,将感兴趣基因组序列鉴定为种系或体细胞的方法包括:通过一个或多个处理器从针对患者样品获得的患者基因组序列内在基因组基因座处选择感兴趣基因组序列,该患者样品包括肿瘤核酸分子和非肿瘤核酸分子的混合物;通过该一个或多个处理器,选择针对该感兴趣基因组序列的一个或多个代理基因组序列;通过该一个或多个处理器,使用该感兴趣基因组序列的观察到的等位基因频率和指示该一个或多个代理基因组序列的观察到的等位基因频率的汇总统计量或分布来确定等位基因频率距离;以及通过该一个或多个处理器,使用该等位基因频率距离来将该感兴趣基因组序列鉴定(例如,分类)为种系或体细胞。
[0013]在该方法的一些实施例中,汇总统计量是平均等位基因频率或中位等位基因频率。在一些实施例中,等位基因频率距离是使用感兴趣基因组序列的观察到的等位基因频
率和指示多个代理基因组序列的观察到的频率的分布来确定的,并且其中基于感兴趣基因组序列的观察到的等位基因频率拟合或不拟合在分布内的概率,将感兴趣基因组序列鉴定为种系或体细胞。
[0014]在一些实施例中,肿瘤核酸分子和非肿瘤核酸分子包括DNA分子。在一些实施例中,肿瘤核酸分子和非肿瘤核酸分子包括RNA分子。
[0015]在一些实施例中,该方法进一步包括对来自患者样品的肿瘤核酸分子和非肿瘤核酸分子进行测序,以确定患者基因组序列。在一些实施例中,使用下一代测序技术获得或确定患者基因组序列。在一些实施例中,测序仪是下一代测序仪。
[0016]在该方法的一些实施例中,一个或多个代理基因组序列位于患者基因组序列的限定片段内,并且所选择的感兴趣基因组序列位于同一限定片段内。在一些实施例中,患者基因组序列基于每个片段内的拷贝数均匀性被分割为多个片段。在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种将感兴趣基因组序列鉴定为种系或体细胞的方法,所述方法包括:提供从来自受试者的样品获得的多个核酸分子,其中所述多个核酸分子包括肿瘤核酸分子和非肿瘤核酸分子的混合物;任选地,将一个或多个衔接子连接到来自所述多个核酸分子的一个或多个核酸分子上;从所述多个核酸分子扩增核酸分子;从所扩增的核酸分子捕获核酸分子,其中所捕获的核酸分子是通过与一个或多个诱饵分子杂交而从所述所扩增的核酸分子捕获的;通过测序仪对所述所捕获的核酸分子进行测序,以获得对应于一个或多个基因组基因座的多个序列读段;通过一个或多个处理器在来自所述一个或多个基因组基因座的基因组基因座处选择感兴趣基因组序列;通过所述一个或多个处理器,选择针对所述感兴趣基因组序列的一个或多个代理基因组序列;通过所述一个或多个处理器,使用所述感兴趣基因组序列的观察到的等位基因频率和指示所述一个或多个代理基因组序列的观察到的等位基因频率的汇总统计量或分布来确定等位基因频率距离;以及通过所述一个或多个处理器,使用所述等位基因频率距离来将所述感兴趣基因组序列鉴定为种系或体细胞。2.根据权利要求1所述的方法,其中所述受试者是癌症患者。3.根据权利要求1或权利要求2所述的方法,其中所述样品包括组织活检样品、液体活检样品、循环肿瘤细胞(CTC)样品、无细胞DNA(cfDNA)样品或正常对照。4.根据权利要求3所述的方法,其中所述样品为液体活检样品并且包括血液、血浆、脑脊髓液、痰、粪便、尿液或唾液。5.根据权利要求1至3中任一项所述的方法,其中所述肿瘤核酸分子源自异质组织活检样品的肿瘤部分,并且所述非肿瘤核酸分子源自所述异质组织活检样品的正常部分。6.根据权利要求1至3中任一项所述的方法,其中所述肿瘤核酸分子源自无细胞DNA样品的循环肿瘤DNA(ctDNA)分数,并且所述非肿瘤核酸分子源自无细胞DNA样品的非肿瘤分数。7.根据权利要求1至6中任一项所述的方法,其中所述一个或多个衔接子包括扩增引物或测序衔接子。8.根据权利要求1至7中任一项所述的方法,其中所述一个或多个诱饵分子包括一个或多个核酸分子,每个核酸分子包括与所捕获的核酸分子的区域互补的区域。9.根据权利要求1至8中任一项所述的方法,其中扩增核酸分子包括:执行聚合酶链式反应(PCR)或等温扩增技术。10.根据权利要求1至9中任一项所述的方法,其中所述测序包括使用下一代测序(NGS)技术。11.根据权利要求1至10中任一项所述的方法,其中所述测序仪包括下一代测序仪。12.权利要求1至11中任一项所述的方法,其中所述一个或多个代理基因组序列位于所
述受试者的基因组序列的限定片段内,并且所选择的感兴趣基因组序列位于同一限定片段内。13.根据权利要求12所述的方法,其中基于每个片段内的拷贝数均匀性将所述受试者的基因组序列分割为多个片段。14.根据权利要求1至13中任一项所述的方法,其中所述汇总统计量是平均等位基因频率或中位等位基因频率。15.根据权利要求1至14中任一项所述的方法,其中使用所述感兴趣基因组序列的所述观察到的等位基因频率和指示多个代理基因组序列的所述观察到的频率的所述分布来确定所述等位基因频率距离,并且其中基于所述感兴趣基因组序列的所述观察到的等位基因频率拟合或不拟合在所述分布内的概率,将所述感兴趣基因组序列鉴定为种系或体细胞。16.一种将感兴趣基因组序列鉴定为种系或体细胞的方法,所述方法包括:通过一个或多个处理器从针对患者样品获得的患者基因组序列内在基因组基因座处选择感兴趣基因组序列,所述患者样品包括肿瘤核酸分子和非肿瘤核酸分子的混合物;通过所述一个或多个处理器,选择针对所述感兴趣基因组序列的一个或多个代理基因组序列;通过所述一个或多个处理器,使用所述感兴趣基因组序列的观察到的等位基因频率和指示所述一个或多个代理基因组序列的观察到的等位基因频率的汇总统计量或分布来确定等位基因频率距离;以及通过所述一个或多个处理器,使用所述等位基因频率距离来将所述感兴趣基因组序列鉴定为种系或体细胞。17.根据权利要求16所述的方法,其包括:通过测序仪对来自所述患者样品的所述肿瘤核酸分子和所述非肿瘤核酸分子进行测序,以确定所述患者基因组序列。18.根据权利要求17所述的方法,其中使用下一代测序技术获得所述患者基因组序列。19.根据权利要求17所述的方法,其中所述测序仪为下一代测序仪。20.根据权利要求16至19中任一项所述的方法,其中所述一个或多个代理基因组序列位于所述患者基因组序列的限定片段内,并且所选择的感兴趣基因组序列位于同一限定片段内。21.根据权利要求20所述的方法,其中基于每个片段内的拷贝数均匀性将所述患者基因组序列分割为多个片段。22.根据权利要求20或21的方法,其包括将所述患者基因组序列分割为多个片段。23.根据权利要求16至22中任一项所述的方法,其中所述汇总统计量是平均等位基因频率或中位等位基因频率。24.根据权利要求16至23中任一项所述的方法,其中使用所述感兴趣基因组序列的所述观察到的等位基因频率和指示多个代理基因组序列的所述观察到的频率的所述分布来确定所述等位基因频率距离,并且其中基于所述感兴趣基因组序列的所述观察到的等位基因频率拟合或不拟合在所述分布内的概率,将所述感兴趣基因组序列鉴定为种系或体细胞。25.根据权利要求16至24中任一项所述的方法,其中所述肿瘤核酸分子和所述非肿瘤核酸分子包括DNA分子。
26.根据权利要求16至25中任一项所述的方法,其中所述肿瘤核酸分子和所述非肿瘤核酸分子包括RNA分子。27.根据权利要求16至26中任一项所述的方法,其中使用靶向测序确定所述患者基因组序列。28.根据权利要求27所述的方法,其中所述靶向测序包括对与癌症相关联的一个或多个基因或其部分的靶向测序。29.根据权利要求27或权利要求28所述的方法,其中所述靶向测序包括对一个或多个外显子区域的靶向测序。30.一种将感兴趣基因组序列鉴定为种系或体细胞的方法,所述方法包括:通过一个或多个处理器,鉴定患者样品中在基因组基因座处的感兴趣基因组序列;通过所述一个或多个处理器,鉴定针对所述感兴趣序列的一个或多个代理基因组序列;通过所述一个或多个处理器,将所述感兴趣基因组序列的观察到的频率与所述一个或多个代理基因组序列的观察到的频率的中心性量度进行比较;以及基于所述比较,通过所述一个或多个处理器,将所述感兴趣基因组序列鉴定为种系或体细胞。31.根据权利要求30所述的方法,其进一步包括:通过所述一个或多个处理器鉴定患者的基因组的片段,所述片段中包括所述基因组基因座。32.根据权利要求31所述的方法,其中通过所述一个或多个处理器鉴定所述片段包括:对所述患者的基因组的连续部分执行分割过程。33.根据权利要求32所述的方法,其中所述患者的基因组的所述部分大到足以鉴定三个不同的片段。34.根据权利要求31所述的方法,其中所述代理由所述一个或多个处理器鉴定为位于与所述基因组基因座相同的片段内。35.根据权利要求32所述的方法,其中通过所述一个或多个处理器,所述分割过程根据基因组参数跨每个单独片段的整体是否相等来鉴定片段。36.根据权利要求35所述的方法,其中所述基因组参数为拷贝数。37.根据权利要求16至36中任一项所述的方法,其中通过一个或多个处理器将所述感兴趣基因组序列鉴定为种系或体细胞包括:将等位基因频率距离输入到经训练的统计模型中;以及从所述经训练的统计模型输出指示所述感兴趣基因组序列为种系的可能性的值或指示所述感兴趣基因组序列为体细胞的可能性的值。38.根据权利要求16至37中任一项所述的方法,其中调整所述等位基因频率距离以校正所述患者样品中的污染水平、低测序读段深度、等位基因频率的噪声估计、低片段种系单核苷酸多态性(SNP)计数或片段种系SNP等位基因频率的高变异性。39.根据权利要求37或权利要求38所述的方法,其中所述经训练的统计模型包括函数,所述函数将所述等位基因频率距离与指示所述感兴趣基因组序列为种系的可能性的所述值或指示所述感兴趣基因组序列为体细胞的可能性的所述值相关联。40.根据权利要求37至39中任一项所述的方法,其中所述经训练的统计模型为逻辑回
归模型。41.根据权利要求37至40中任一项所述的方法,其进一步包括:使用针对具有已知种系序列的肿瘤样品的数据来训练所述统计模型。42.根据权利要求37至41中任一项所述的方法,其进一步包括:使用针对具有已知种系序列和已知体细胞序列的肿瘤样品的数据来训练所述统计模型。43.根据权利要求37至40中任一项所述的方法,其中使用针对具有已知种系序列的肿瘤样品的数据来训练所述经训练的统计模型。44.根据权利要求43所述的方法,其中使用针对具有已知种系序列和已知体细胞序列的肿瘤样品的数据来训练所述经训练的统计模型。45.根据权利要求37至44中任一项所述的方法,其进一步包括:使用针对变体等位基因频率的数据来训练所述统计模型,所述数据排除位于已知具有偏离预期值的等位基因频率的基因组区域中的变体。46.根据权利要求37至44中任一项所述的方法,其中使用针对变体等位基因频率的数据来训练所述经训练的统计模型,所述数据排除位于已知具有偏离预期值的等位基因频率的基因组区域中的变体。47.根据权利要求37至46中任一项所述的方法,其进一步包括:使用结合以下的数据来训练所述统计模型:基于历史数据或数据库,变体为种系变体、体细胞变体或不确定潜能的克隆性造血(CHIP)变体的可能性的先验知识。48.根据权利要求37至46中任一项所述的方法,其中使用结合以下的数据来训练所述经训练的统计模型:基于历史数据或数据库,变体为种系变体、体细胞变体或不确定潜能的克隆性造血(CHIP)变体的可能性的先验知识。49.根据权利要求37至48中任一项所述的方法,其进一步包括:使用考虑到针对给定变体调用及其基因组情景的噪声水平的数据来训练所述统计模型。50.根据权利要求37至48中任一项所述的方法,其中使用考虑到针对给定变体调用及其基因组情景的噪声水平的数据来训练所述经训练的统计模型。51.根据权利要求16至50中任一项所述的方法,其中所述一个或多个代理基因组序列包括单核苷酸多态性(SNP)。52.根据权利要求16至51中任一项所述的方法,其中所述一个或多个代理基因组序列包括等位基因。53.根据权利要求16至52中任一项所述的方法,其中所述感兴趣基因组序列包括基因组变体。54.根据权利要求16至53中任一项所述的方法,其进一步包括:通过所述一个或多个处理器,生成指示所述感兴趣基因组序列为种系或体细胞的报告。55.根据权利要求54所述的方法,其包括将所述报告传输到医疗保健提供者。56.根据权利要求54或权利要求55所述的方法,其中经由计算机网络或对等连接传输所述报告。57.根据权利要求16至56中任一项所述的方法,其中所述患者样品源自包括肿瘤组织和非肿瘤组织的组织活检。58.根据权利要求57所述的方法,其中所述组织活检是固体组织活检或液体活检。
59.根据权利要求58所述的方法,其中所述组织活检为包括血液、血浆、脑脊髓液、痰、粪便、尿液或唾液的液体活检。60.根据权利要求16至59中任一项所述的方法,其中所述患者样品包括从所述受试者获得的无细胞DNA(cfDNA)。61.根据权利要求16至60中任一项所述的方法,其中所述患者样品包括从所述受试者获得的循环肿瘤DNA(ctDNA)。62.一种治疗患者的癌症的方法,其包括:通过一个或多个处理器,使用权利要求16至61中任一项所述的方法将一个或多个感兴趣基因组序列鉴定为体细胞;基于一个或多个所鉴定的体细胞序列来选择癌症治疗方式;以及使用所选择的癌症治疗方式治疗所述癌症。63.根据权利要求62所述的方法,其中所述一个或多个所鉴定的体细胞序列与使用所述所选择的治疗方式的成功癌症治疗相关联。64.根据权利要求62所述的方法,其包括:通过所述一个或多个处理器,使用所述一个或多个所鉴定的体细胞序列来确定所述癌症的微卫星不稳定性状态;以及基于所述癌症的所述微卫星不稳定性状态来选择所述癌症治疗方式。65.根据权利要求62所述的方法,其包括:通过所述一个或多个处理器,使用所述一个或多个所鉴定的体细胞序列来确定针对所述癌症的肿瘤突变负荷;以及基于所述肿瘤突变负荷高于预定肿瘤突变负荷阈值来选择所述癌症治疗方式。66.根据权利要求64或权利要求65所述的方法,其中在所述肿瘤突变负荷高于预定阈值的情况下,所述癌症治疗方式包括向所述患者施用有效量的一种或多种抗癌剂。67.根据权利要求66所述的方法,其中所述一种或多种抗癌剂包括免疫肿瘤剂。68.根据权利要求67所述的方法,其中所述免疫肿瘤剂为免疫检查点抑制剂。69.一种监测患者的癌症进展或复发的方法,其包括:通过所述一个或多个处理器,使用权利要求16至67中任一项所述的方法将一个或多个感兴趣基因组序列鉴定为体细胞,其中所述患者样品从患有癌症的患者获得;以及在所述癌症已经被治疗之后,通过所述一个或多个处理器,检测从患者获得的第二患者样品内被鉴定为体细胞的所述一个或多个感兴趣基因组序列的存在或不存在。70.根据权利要求69所述的方法,其包括从所述患者获得所述第二患者样品。71.根据权利要求69或权利要求70所述的方法,其包括:在从所述患者获得第一患者样品之后和在从所述患者获得所述第二患者样品之前治疗所述患者的所述癌症。72.根据权利要求69至71中任一项所述的方法,其中所述第二患者样品包括无细胞DNA。73.根据权利要求69至72中任一项所述的方法,其中检测所述第二患者样品内被鉴定为体细胞的所述一个或多个感兴趣基因组序列的存在或不存在包括:对所述第二患者样品中的核酸分子进行测序。74.一种为针对患有癌症的受试者个性化的癌症疫苗选择新抗原的方法,其包括:
通过所述一个或多个处理器,使用权利要求16至67中任一项所述的方法将一个或多个感兴趣基因组序列鉴定为体细胞,其中被鉴定为体细胞的所述一个或多个感兴趣基因组序列位于基因的外显子区域内;以及通过所述一个或多个处理器,从被鉴定为体细胞的所述一个或多个感兴趣基因组序列选择基因组序列,所述基因组序列编码适合作为所述受试者的癌症疫苗的新抗原。75.根据权利要求74所述的方法,其进一步包括:制备包括所述新抗...

【专利技术属性】
技术研发人员:黄延梅杰森
申请(专利权)人:基金会医学公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1