宏基因组样品中病原体的鉴定和抗生素表征制造技术

技术编号:21439713 阅读:35 留言:0更新日期:2019-06-22 14:37
鉴定宏基因组样品中包含的病原体和鉴定所述病原体基因组中的病原性标志物的方法,该方法包括以下步骤:‑处理(12)宏基因组样品以从病原体中提取DNA,‑测序(14)提取的DNA,从而产生读长组,‑将所述读长组与已知病原体基因组的数据库进行比较(22),以便将读长分配给所述已知病原体;‑产生(26)读长池,其包含分配给病原体的读长,以及组装(28)汇集的读长以产生重叠群,‑将重叠群与遗传标志物的第二数据库进行比较(30),以检查产生的重叠群是否含有标志物,该方法还包括以下步骤:‑将所述读长组与第二数据库进行比较(24)以便将读长分配给标志物,如果它完全落入所述标志物中或者如果它是跨越所述标志物则将读长分配给标志物,并且所述池中还包含分配给所述标志物的读长,因此,所述重叠群由分配给病原体的读长和分配给标志物的读长组装而成。

【技术实现步骤摘要】
【国外来华专利技术】宏基因组样品中病原体的鉴定和抗生素表征
本专利技术涉及宏基因组学领域,且特别是通过断言在其基因组中存在抗生素抗性标志物来表征宏基因组样品中病原体的抗生素敏感性。
技术介绍
目前,临床样品中病原体通过经典微生物学技术的鉴定和抗生素敏感性测试(AST)概况需要大量测试和/或许多关于病原体的先验知识。例如,微生物学工作流程涉及病原体的生长(例如在陪替氏培养皿上)以分离它们并获得后续测试所需的关键生物量。然而,不同的细菌可能需要不同的培养条件(例如好氧细菌与厌氧细菌),如果不以适当的方式选择培养条件,则可在培养期间竞争,或甚至可能根本不生长。因此,培养基的选择通常基于关于样品中病原体的假设。此外,测试需要预先鉴定病原体(例如革兰氏阳性或阴性)以选择AST的试剂。因此,微生物技术的稳健性有时可能是有问题的。此外,经典微生物学需要24小时至48小时才能获得病原体的鉴定和抗生素敏感性测试(AST)概况,甚至需要数周来使细菌(如分枝杆菌)缓慢生长。在这段时间内,临床医生不知道哪种病原体感染患者,并因此不能提供任何特定的治疗。不仅患者的生命可能受到威胁,而且还迫使临床医生在获得AST概况并调整他的治疗之前给予患者广谱抗生素,这是细菌随时间发展抗生素抗性机制的主要原因之一。在微生物学中,宏基因组学是基于核酸(NA)测序的技术,其旨在使用线性工作流程来表征样品的微生物含量,其中关于该含量的先验信息较少。特别是,宏基因组学不涉及细菌的生长以分离它们,并且宏基因组工作流程中步骤的选择不依赖于前述步骤的结果。此外,工作流程持续时间基本上与样品中包含的微生物无关,并且可以处理包含不同微生物(例如不同细菌物种)的混合物的样品,并同时获得样品的微生物含量的全貌。最近设计了快速且稳健的测序技术,特别是高通量测序(HTS)(例如全基因组测序(WGS)、下一代测序(NGS)),其可以精确和快速地测序大基因组。基于这些技术,HTS宏基因组工作流程包括:a.从患者或动物(例如支气管肺泡灌洗液、血液、尿液、唾液、粪便......)收集的样品(例如组织或体液样品)、食物样品或环境样品(例如空气、水);b.从样品中的细胞中提取核酸(例如基因组DNA);c.将核酸分子随机剪切成较小的片段并标记片段以进行扩增和测序;d.至少对于第二代HTS,扩增片段(例如通过基于PCR的技术)以获得每个片段的多个拷贝,从而允许从测序步骤获得可读信号;e.对片段进行测序,从而产生一组数字的核酸序列(通常称为“原始读长”或“读长”);f.使用计算机处理工作流程(通常称为“生物信息学流程”或“流程”)分析读长以表征样品的内容物(例如,鉴定样品中的微生物)。基本上,有两种类型的流程用于表征样品内容物,第一种类型的流程使用分类学聚类(taxonomicbinning),第二种类型使用分析(profiling)。在过去几年中已经开发了许多分析流程以有效地描述宏基因组样品的分类学和/或功能性(基因含量)组成。例如,“MetaPhlAn2”(Truong等人,“MetaPhlAn2forenhancedmetagenomictaxonomicprofiling”,NatureMethods,2015)是一种有效的分类学分析方法,其依赖于对给定的分类学分支独特且特异性的标志物基因。简言之,将读长匹配到标志物基因参考数据库,然后允许量化样品中存在的所有分类学分支。在更近期的称为“MOCAT2”的分类学和功能性分析流程中(Kultima等人“MOCAT2:ametagenomicassembly,annotationandprofilingframework”,Bioinformatics,2016),使用“SOAPdenovo”组装器组装读长(RuibanaLuo等人“SOAPdenovo2:anempiricallyimprovedmemory-efficientshort-readdenovoassembler”,GigaSicence,2012),针对来自多个数据库(eggNOG、KEGG、SEED、ARDB、CARD....)的功能性信息的组合目录预测并高效注释。分类学和功能性分析可用于首先鉴定和获得病原体的相对比例,并且还获得样品中存在的ARD。关于基于分类学聚类的流程,它们包括分配步骤(也称为“分类学聚类”),其包括:f1.将每个读长分配给已知的分类群(例如细菌物种),其中一个或多个代表性基因组或基因组的一部分(例如基因组的16S部分)已被测序并存储在参考数据库(“分类学数据库”)中;f2.汇集分配给分类群的读长;以及f3.组装汇集的读长以便重建分类群的基因组,通常是其长序列,通常称为“重叠群”。然后将重叠群用于进一步表征,特别是鉴定病原体和在重构的基因组中搜索抗生素抗性决定簇(ARD)。因此,HTS技术允许同时访问样品中存在的病原体组,但也允许访问其基因组中包含的(ARD)组。然而,那些技术不能将ARD与病原体关联起来,这是对于想要知道样本中存在哪种病原体以及该特定病原体携带哪种ARD(如果有的话)的临床医生而言的主要信息。此外,临床医生感兴趣的是获得样品中存在的ARD的序列。实际上,抗生素抗性可能是由于抗性基因的存在或不存在,也可能是由于特异性抗性基因变体的存在,并且在这种情况下,获得最准确的抗性决定簇序列是至关重要的。避免这个问题的第一步是应用Guigon等人(“PathogenCharacterizationwithintheMicrobialFloraofBronchoalveolarLavagesbyDirectSampleSequencing”,ECCMID,2015)描述的流程,并在这个文件的续集中称为“流程1”。简而言之,主要步骤是:读长的质量控制(低质量读长的过滤和修整)、宿主DNA的消除(人类读长的过滤)、分类学聚类、将样品中存在的对应于每种病原体的读长组装成“重叠群”、且最后是相对于ARD参考数据库注释重叠群。遗憾的是,只有当所述关联在参考数据库中明确编码时,上述流程才有效地导出病原体和ARD之间的关联。图1说明了典型的故障情况。宏基因组样品包括来自具有抗性基因的细菌物种(“物种1”)的DNA。如同细菌中的许多抗性基因,所考虑的基因位于移动遗传因子(MGE)上。MGE是一种在细菌基因组之间移动的DNA,且是遗传变异的重要来源,并因此也是细菌的抗生素适应能力的来源。遗憾的是,在用于分类学聚类的参考数据库中,与其他物种(“物种k”)的代表性基因组相反,物种1的代表性基因组中没有一个具有该ARD。这可能发生,正是因为这个ARD位于MGE上。例如,研究的样品中存在的来自物种1的微生物最近可能从物种k的菌株获得它,尽管在用于构建分类学聚类的参考数据库的参考序列中尚未观察到这种转移。因此,在分类学聚类步骤期间,位于物种1的ARD区域中的读长将不会与物种1的其他读长一起检索,因为他们将被分开作为物种k的代表。因此,在最好的情况下,物种1的组装将导致2个重叠群,并且组装中将缺少ARD。换句话说,参考数据库是关于病原体的瞬间可获取的知识的静态快照。对于现有技术的流程,考虑与ARD相关的病原体的基因组修饰的唯一方法是更新数据库。临床医生至少第一次面临新病原体时本文档来自技高网...

【技术保护点】
1.鉴定宏基因组样品中包含的病原体和鉴定所述病原体基因组中的病原性标志物的方法,所述方法包括以下步骤:‑处理(12)宏基因组样品以至少从所述样品中存在的病原体中提取DNA,‑测序(14)提取的DNA,从而产生数字核酸序列的组,或“读长”,‑将所述读长组与包含已知病原体基因组的第一数据库进行比较(22),以便将所述组的读长分配给所述已知病原体;‑产生(26)读长池,其包含至少在所述已知细菌病原体中分配给病原体的读长,以及组装(28)所述池中的读长以产生至少一个经组装的数字核酸序列,或“重叠群”,‑将产生的所述重叠群与已知病原性遗传标志物的第二数据库进行比较(30),以检查产生的所述重叠群是否含有已知的标志物,‑其特征在于,‑所述方法包括将所述读长组与第二数据库进行比较(24)的步骤,以便将所述组的读长分配给所述已知的病原性标志物,如果它完全落入所述标志物中或者如果它跨越所述标志物则将读长分配给已知的病原性标志物,‑并且所述池中还包含分配给所述已知病原性标志物的读长,因此,所述重叠群由分配给所述已知病原体的读长和分配给所述已知病原性标志物的读长组装而成。

【技术特征摘要】
【国外来华专利技术】2016.10.13 EP 16193621.61.鉴定宏基因组样品中包含的病原体和鉴定所述病原体基因组中的病原性标志物的方法,所述方法包括以下步骤:-处理(12)宏基因组样品以至少从所述样品中存在的病原体中提取DNA,-测序(14)提取的DNA,从而产生数字核酸序列的组,或“读长”,-将所述读长组与包含已知病原体基因组的第一数据库进行比较(22),以便将所述组的读长分配给所述已知病原体;-产生(26)读长池,其包含至少在所述已知细菌病原体中分配给病原体的读长,以及组装(28)所述池中的读长以产生至少一个经组装的数字核酸序列,或“重叠群”,-将产生的所述重叠群与已知病原性遗传标志物的第二数据库进行比较(30),以检查产生的所述重叠群是否含有已知的标志物,-其特征在于,-所述方法包括将所述读长组与第二数据库进行比较(24)的步骤,以便将所述组的读长分配给所述已知的病原性标志物,如果它完全落入所述标志物中或者如果它跨越所述标志物则将读长分配给已知的病原性标志物,-并且所述池中还包含分配给所述已知病原性标志物的读长,因此,所述重叠群由分配给所述已知病原体的读长和分配给所述已知病原性标志物的读长组装而成。2.根据权利要求1所述的方法,其中跨越所述标志物的所述读长具有落入所述标志物内的部分,其长度大于或等于20bp。3.根据权利要求1或2所述的方法,其中所述读长具有平均长度Lbp,L>100,并且其中跨越所述标志物的读长具有[1;L-50]bp的范围内的落在所述标志物外的部分。4.根据权利要求1、2或3所述的方法,其中跨越所述标志物的读长具有落入所述标志物的第一部分和落在所述标志物之外的第二部分,并且其中所述第二部分的长度基于针对ARD数据库性能的匹配选择。5.根据权利要求4所述的方法,其中,选择所述第二部分的长度,使得针对ARD数据库的正确分配的概率大于或等于70%,优选地大于或等于80%。6.根据前述权利要求中任一项所述的方法,其中所述读长组与所述第二数据库的比较包括独立于所述组的其他读长的每个读长对所述第二数据库的病原性标志...

【专利技术属性】
技术研发人员:P·马埃M·图尔努德S·斯奇克林G·贵贡E·鲁佩
申请(专利权)人:生物梅里埃公司
类型:发明
国别省市:法国,FR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1