基因组测序和检测技术制造技术

技术编号:36172197 阅读:10 留言:0更新日期:2022-12-31 20:24
本发明专利技术描述了一种核酸测序技术。可以分析例如由测序装置生成的序列数据以扫描该序列数据中的单独读段中固定大小n的k聚体。识别该序列数据中的该k聚体与参考k聚体的精确匹配。K聚体匹配可用于识别序列数据中具有与污染或其他质量问题相关联的异常分布的替代等位基因,并且实时确定质量度量。并且实时确定质量度量。并且实时确定质量度量。

【技术实现步骤摘要】
【国外来华专利技术】基因组测序和检测技术
[0001]相关申请的交叉引用
[0002]本申请要求于2020年5月8日提交的美国临时申请号63/022,296的优先权和权益,其公开内容以引用方式并入本文。

技术介绍

[0003]所公开的技术整体涉及核酸表征,例如测序技术。在一些实施方案中,所公开的技术包括用于从基于基因组测序(例如,全基因组测序)的序列数据进行病毒检测的快速准确的方法。
[0004]本部分中讨论的主题不应仅因为在本部分中有提及就被认为是现有技术。类似地,在本部分中提及的或与作为
技术介绍
提供的主题相关联的问题不应被认为先前在现有技术中已被认识到。本部分中的主题仅表示不同的方法,这些方法本身也可对应于受权利要求书保护的技术的具体实施。
[0005]下一代测序技术提供越来越高的测序速度,从而允许更大的测序深度。然而,测序准确度和灵敏度受到来自各种来源的错误和噪声的影响,例如,在库制备期间的样品缺陷或PCR偏差。因此,诸如在包括低浓度病毒或细菌核酸的宿主样品中检测频率非常低的序列可能是复杂的。因此,期望开发用于以快速且准确的方式对以低量存在的核酸分子进行检测和/或测序的方法。
[0006]简要说明
[0007]在一个实施方案中,本公开涉及一种实时质量控制方法。该方法包括使用进行测序运行的测序装置从生物样品生成序列数据;识别序列数据中在散列表中具有精确匹配的k聚体,该散列表用包含参考等位基因k聚体和参考等位基因的替代等位基因k聚体的k聚体集合初始化;基于所述精确匹配的计数确定所述参考等位基因和所述替代等位基因在所述序列数据中的分布;以及基于分布并且在生物样品的测序运行期间生成生物样品的质量度量。
[0008]在另一个实施方案中,本公开涉及一种测序装置,该测序装置包括其上装载有从样品制备的测序库的基底。测序装置还包括计算机,该计算机被编程为使测序装置进行测序运行以从测序库生成序列数据;识别序列数据中在散列表中具有精确匹配的k聚体,该散列表用包含参考等位基因k聚体和参考等位基因的替代等位基因k聚体的k聚体集合初始化;基于所述精确匹配的计数确定所述参考等位基因和所述替代等位基因在所述序列数据中的分布;并且基于测序运行期间的分布在测序装置上生成生物样品的质量度量。
[0009]在另一个实施方案中,本公开涉及一种在生物样品中进行变体检测的方法。该方法包括使用引物对从生物样品生成扩增子;从所生成的扩增子制备测序库;从所述测序库生成序列数据;识别所述序列数据中的序列读段,所述序列读段在单独引物对中的引物的引物区域内开始并且与所述引物在相同方向上;修剪与所述引物在所述相同方向上的所识别的序列读段以排除所述引物区域中的序列;以及识别未修剪的序列读段中跨越引物区域或者在与引物不同的方向上并且在未修剪序列读段中与引物区域相对应或互补的位置处
的变体序列。
[0010]呈现前述描述以使得能够制造和使用所公开的技术。对所公开的具体实施的各种修改将是显而易见的,并且在不脱离所公开的技术的实质和范围的情况下,本文所定义的一般原理可应用于其他具体实施和应用。因此,所公开的技术并非旨在限于所示的具体实施,而是要符合与本文所公开的原理和特征一致的最广范围。所公开的技术的范围由所附权利要求限定。
附图说明
[0011]当参考附图阅读以下详细描述时将更好地理解本专利技术的这些和其他特征、方面和优点,其中在整个附图中相同的字符表示相同的部件,其中:
[0012]图1是根据本公开的各方面的用于k聚体比对的工作流程的示意图;
[0013]图2是根据本公开的各方面的基因组的示例性k聚体的示意图;
[0014]图3是根据本公开的各方面的用于从测序数据进行病毒检测的方法的示意图;
[0015]图4是根据本公开的各方面的用于基于比对的病毒检测的方法的示意图;
[0016]图5是根据本公开的各方面的基于比对的病毒检测中的靶区域或k聚体覆盖范围的示意图;
[0017]图6是根据本公开的各方面的生成用于病原体检测的病原体特异性k聚体和对照k聚体的集合的方法的示意图;
[0018]图7是根据本公开的各方面的被配置成采集测序数据并执行基于比对的检测的系统的框图;
[0019]图8示出了用于病原体检测的样品制备的示例性工作流程;
[0020]图9示出了图8的工作流程的扩增子测序结果;并且
[0021]图10示出了引物修剪后的变体识别。
具体实施方式
[0022]呈现以下讨论以使得本领域的任何技术人员能够实现和使用所公开的技术,并且在特定应用及其要求的上下文中提供以下讨论。对所公开的具体实施的各种修改对于本领域的技术人员而言将是显而易见的,并且在不脱离所公开的技术的实质和范围的情况下,本文所定义的一般原理可应用于其他具体实施和应用。因此,所公开的技术并非旨在限于所示的具体实施,而是要符合与本文所公开的原理和特征一致的最广范围。
[0023]本文描述了允许表征核酸的多种方法和组合物。在实施方案中,所公开的技术用作从生物样品生成的序列数据的序列分析的一部分,以快速且准确地检测感兴趣的基因组序列。在实施方案中,所公开的技术使用基于超快散列的比对器来从序列数据生成减少错误或无错误的子序列。所公开的技术的一个应用是快速检测测序库中存在的病毒基因组。该技术操作以在测序库的每个序列读段中扫描固定大小“n”的每个k聚体,并在散列表中查找存在/不存在。散列表用病毒基因组的所有n个k

聚体或其精选子集进行初始化。例如,可以使用精选来移除对于感兴趣的病原体不是唯一的k聚体。对于每个病毒k聚体,计数序列k聚体相对于散列表的成功匹配。
[0024]在实施方案中,使用对病毒唯一的k聚体的完整或减少(例如,精选)集合的快速、
精确k聚体匹配的专门比对器用于检测具有人类阳性对照扩增子的病原体感染。然而,所公开的技术可以用于其他应用,诸如检测生物样品中的种系变体、微生物组表征、在环境监测(例如,污水监测)中检测汇集或复杂的输入样品。此外,所公开的技术可以用于检测感兴趣的单一病原体(例如,SARS

CoV

2)或检测病原体组中的一种或多种病原体,例如呼吸病原体组(SARS

CoV

2、RSV、肺炎、流感)或包括代表特定病原体的不同菌株的k聚体的菌株跟踪组。
[0025]图1是示例性工作流程12,其包括通过可与所公开的技术结合使用的序列分析进行样品处理的步骤。样品20经历处理或样品制备24以产生测序库,该测序库包括适合于测序步骤28以生成序列数据30的多个核酸片段。序列数据30可以经历某些主要分析步骤,例如,质量或过滤,然后被传递到如本文通常提供的k聚体扫描和k聚体比对。
[0026]扫描所生成的序列数据30以识别固定大小n的k聚体,并且将这些所识别的k聚体提供给k聚体比对器36。k聚体比对器36可以包括用从参考基因组得出的大小n的已知k聚体的集合34初始化的散列表。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种实时质量控制方法,包括:使用进行测序运行的测序装置从生物样品生成序列数据;识别所述序列数据中在散列表中具有精确匹配的k聚体,所述散列表用包含参考等位基因k聚体和所述参考等位基因的替代等位基因k聚体的k聚体集合初始化;基于所述精确匹配的计数确定所述参考等位基因和所述替代等位基因在所述序列数据中的分布;以及基于所述分布并且在所述生物样品的所述测序运行期间生成所述生物样品的质量度量。2.根据权利要求1所述的方法,包括基于所述质量度量将所述生物样品标记为被污染。3.根据权利要求2所述的方法,其中所述替代等位基因存在于所污染的样品中的所述序列数据的5%或更少的序列读段中。4.根据权利要求1所述的方法,包括基于所述序列数据中所述参考等位基因与所述替代等位基因的比率在预期范围内来指示所述生物样品通过所述质量度量。5.根据权利要求1所述的方法,其中所述质量度量是在所述测序装置上生成的。6.根据权利要求1所述的方法,其中所述替代等位基因包含先前表征的单核苷酸多态性。7.一种测序装置,包括:基底,所述基底上装载有从样品制备的测序库;计算机,所述计算机被编程为:使所述测序装置进行测序运行以从测序库生成序列数据;识别所述序列数据中在散列表中具有精确匹配的k聚体,所述散列表用包含参考等位基因k聚体和所述参考等位基因的替代等位基因k聚体的k聚体集合初始化;基于所述精确匹配的计数确定所述参考等位基因和所述替代等位基因在所述序列数据中的分布;并且基于所述测序运行期间的所述分布在所述测序装置上生成所述生物样品的质量度量。8.根据权利要求7所述的测序装置,包括显示器,所述显示器显示所述质量度量。9.根据权利要求7所述的测序装置,包括通信电路,所述通信电路基于所述生物样品的所述质量度量与通过相关联来将所生成的序列数据传送到云计算环境。10.根据权利要求9所述的测序装置,其中所述生物样品的所述质量度量与所述参考等位基因和所述...

【专利技术属性】
技术研发人员:S
申请(专利权)人:因美纳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1