【技术实现步骤摘要】
用于改善基于扩增子测序的微生物群落分类学解析的方法和系统相关申请的交叉引用和优先权本申请要求2018年8月10日提交的印度临时专利申请号201821030219的优先权。上述申请的全部内容通过引用纳入本文中。
本文的实施方式一般涉及微生物群落的分类学概况分析(profiling)领域。更具体地,但非特定地,本专利技术提供了用于改善基于扩增子测序的微生物群落分类学分析或解析的系统和方法。
技术介绍
16SrRNA基因的测序是细菌物种的分类学表征的标准方案。Sanger测序通常用于获得单种细菌的“全长”16SrRNA基因序列。新一代测序(NGS)技术能够以前所未有的测序深度探测不同环境中的微生物多样性。这些区域(包括一个或多个可变区或V区)的测序已经用于微生物组研究,以获得研究环境中存在的细菌群的分类学指定。然而,由于流行的NGS技术的读出长度限制,基于16S扩增子测序的微生物组研究依赖于靶向16SrRNA基因的短区段,其包括选择可变(V)区。在大多数情况下,这种短区段构成在16SrRNA基因上彼此相邻放 ...
【技术保护点】
1.一种基于扩增子测序来提高微生物群落的分类学概况分析的准确度的方法,包括:/n从环境采集生物样品;/n从生物样品中获得第一子样品和第二子样品;/n从第一子样品和第二子样品提取微生物DNA;/n使用测序仪对从第一子样品提取的微生物DNA进行测序,以获得DNA序列数据,其中所述DNA序列数据包含多对序列片段,并且其中多对序列片段中的每对通过对扩增子的配对末端测序产生,所述扩增子包括扩增子内信息区的第一组合,并且其中所述信息区包括系统发育相关信息;/n使用测序仪对从第二子样品提取的DNA进行测序,以获得DNA序列数据,其中DNA序列数据包含多对序列片段,并且其中多对序列片段中的 ...
【技术特征摘要】
20180810 IN 2018210302191.一种基于扩增子测序来提高微生物群落的分类学概况分析的准确度的方法,包括:
从环境采集生物样品;
从生物样品中获得第一子样品和第二子样品;
从第一子样品和第二子样品提取微生物DNA;
使用测序仪对从第一子样品提取的微生物DNA进行测序,以获得DNA序列数据,其中所述DNA序列数据包含多对序列片段,并且其中多对序列片段中的每对通过对扩增子的配对末端测序产生,所述扩增子包括扩增子内信息区的第一组合,并且其中所述信息区包括系统发育相关信息;
使用测序仪对从第二子样品提取的DNA进行测序,以获得DNA序列数据,其中DNA序列数据包含多对序列片段,并且其中多对序列片段中的每对通过对扩增子的配对末端测序产生,所述扩增子包括扩增子内信息区的第二组合,其中信息区的第二组合不同于信息区的第一组合,并且其中扩增子测序试验靶向系统发育标志物基因;
通过采用分类学分类方法,通过一个或多个硬件处理器,产生第一测序子样品的微生物分类丰度概况,其中分类学分类方法利用对应于信息区的第一组合的系统发育相关信息,其中微生物分类丰度概况包括对应于一对或多对序列片段的丰度值,其包括分类为多个分类群的信息区的第一组合;
通过采用分类学分类方法,通过一个或多个硬件处理器,产生第二测序子样品的微生物分类丰度概况,其中分类学分类方法利用对应于信息区的第二组合的系统发育相关信息,其中微生物分类丰度概况包括对应于一对或多对序列片段的丰度值,其包括分类为多个分类群的信息区的第二组合;
通过一个或多个硬件处理器,预计算属于多个分类群的微生物的信息区的所有不同可能组合的分类学分类准确度,以生成计算表,其中预计算基于现有序列数据库中存在的已知分类学来源的标志物基因序列;和
通过一个或多个硬件处理器,基于计算表将第一和第二测序子样品的微生物分类丰度概况组合,以生成组合的微生物分类丰度概况,其中与第一和第二子样品单独获得的微生物分类丰度概况相比,或与使用靶向系统发育标志物基因中信息区的任何组合的扩增子测序获得的整个生物样品或生物样品的任何其他子样品的微生物分类丰度概况相比,组合的微生物分类丰度概况具有精化的丰度值以及改善的分类学分类准确度。
2.如权利要求1所述的方法,其中,将微生物分类丰度概况组合的步骤采用组合策略来提高分类学概况分析的准确度,其中所述组合策略还包括:
使用利用信息区的第一组合和信息区的第二组合的分类学分类方法,产生对应于第一和第二测序子样品的特定分类群“i”的丰度值(Tix和Tiy);
使用信息区的第一组合和信息区的第二组合,提供特定分类群“i”的分类学分类的预计算的相对准确度Wix和Wiy;和
使用以下公式计算特定分类群“i”的精化的丰度值(Tixy):
3.如权利要求1所述的方法,还包括计算全部分类群的精化的丰度值,以获得与单独获得的第一和第二子样品的微生物分类丰度概况相比更准确的微生物分类丰度概况。
4.如权利要求1所述的方法,其中,进行所述扩增子测序以靶向所述系统发育标志物基因或所述系统发育标志物基因的部分。
5.如权利要求1所述的方法,其中,信息区的第一组合和信息区的第二组合可包括在扩增子测序中被靶向的标志物基因中连续或非连续排列的信息区,其中所述扩增子测序靶向系统发育标志物基因。
6.如权利要求1所述的方法,其还包括获得靶向多个不同信息区的多于两个子样品的步骤,其中所述多于两个子样品还被配置使用组合策略来提高分类学概况分析的准确度。
7.如权利要求1所述的方法,其中进行测序以产生构成16SrRNA基因或16SrRNA基因的部分的扩增子,并且其中,16SrRNA基因包含多个系统发育信息区。
8.如权利要求1所述的方法,其中,信息区是16SrRNA基因扩增子中的可变区。
9.如权利要求1所述的方法,其中,对于选择用于扩增子测序的标志物基因内的信息区的第一组合和信息区的第二组合以及系统发育标志物基因的选择基于属于多个分类群的微生物的信息区的全部不同可能组合的预计算的分类学分类准确度,所述多个分类群可预期处于采集所述生物样品的环境中。
10.一种用于改进基于扩增子的微生物群落分类学解析的系统,该系统包括:
用于从环境采集生物样品的样...
【专利技术属性】
技术研发人员:S·S·曼德,A·杜塔,N·K·皮那,M·M·哈克,
申请(专利权)人:塔塔咨询服务有限公司,
类型:发明
国别省市:印度;IN
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。