一种检测细菌16S rDNA全长的建库测序方法技术

技术编号:22560479 阅读:59 留言:0更新日期:2019-11-16 09:48
本发明专利技术公开了一种检测细菌16S rDNA全长的建库测序方法,通过在每个样品上加上分子标签UMI,分别扩增得到连接文库和拼接文库,对两个文库进行测序,通过识别UMI组合的方式提取数据,并组装出16S rDNA全长序列,进而比对数据库确定菌种种类。本发明专利技术的建库方法适合所有类型样本的菌群结构检测,能够将传统的菌群结构鉴定从“属”级别提升到“种”级别,与属水平相比较,种水平的优势,可以更准确的确定环境微生物的生态结构,便于深入研究,由此可对样本进行特定细菌菌种的检测。

A library building and sequencing method for the detection of bacterial 16S rDNA

The invention discloses a library building and sequencing method for detecting the total length of 16S rDNA of bacteria. By adding a molecular tag UMI to each sample, the connection library and the splicing library are respectively amplified, and the two libraries are sequenced. The data are extracted by identifying the combination of UMI, and the total length sequence of 16S rDNA is assembled, and then the species of bacteria is determined by comparing the database. The database building method of the invention is suitable for the detection of bacterial group structure of all types of samples, and can improve the traditional identification of bacterial group structure from the \Genus\ level to the \species\ level. Compared with the genus level, the advantages of the species level can more accurately determine the ecological structure of environmental microorganisms, which is convenient for in-depth study, so that the samples can be tested for specific bacterial species.

【技术实现步骤摘要】
一种检测细菌16SrDNA全长的建库测序方法
本专利技术属于细菌分子生物学
,具体涉及一种检测细菌16SrDNA全长的建库测序方法。
技术介绍
16SrRNA基因是原核生物所特有的基因,并且在原核生物中具有极高的拷贝数。全长1542nt的DNA序列包含9个间隔的高变区,兼具特异性和保守性的16SrRNA基因序列作为微生物标记被广泛应用于研究中。之前再对16S人DNA进行研究时,通常使用的是Sanger测序结合克隆的方法,或者芯片杂交方法,但是传统方法存在着通量低的缺陷。很多研究者已经用16SrDNA来对环境中的微生物,粪便微生物,皮肤中的微生物进行分类研究。目前,第二代测序技术已经成为微生物研究的主流手段,但是由于读长的限制,一般基于16SrDNA全长9个可变区中的一个或者几个(V6区、V3-V4区等),而且只能分析到属级别,无法分析到菌种。例如公开号为CN108070643A的中国专利技术专利公开了一种微生物16SrDNA单分子水平测序文库的构建方法,包括采集样本,提取DNA;扩增;纯化;定量;测序,生物信息学分析。但是仍采用是16SrDNAV3-V4区测序方法。该类方法作为市场上最为成熟的细菌检测方法,仍存在某些缺陷。例如不能够完全对细菌的菌种级别进行检测,不能够准确的确定环境微生物的生态结构,以及在用于样本特定细菌菌种的检测,比如:病原菌,益生菌的检测。对于深入研究领域而言是远远不够的。因此需要开发一种建库方法,能够检测样本中细菌的16S全长序列,以便分析样本中的菌种组成,确定样本菌群生态结构。<br>
技术实现思路
针对以上存在的技术问题,本专利技术提供一种检测细菌16SrDNA全长的建库测序方法,能够分析样本中的菌种组成,确定样本菌群生态结构。本专利技术的技术方案为:一种检测细菌16SrDNA全长的建库测序方法,包括以下步骤:(1)定量提取样本中菌群的总DNA,标记为样本A;(2)以步骤(1)样本A的DNA为模板,通过两端带有特异分子标签UMI的引物组PCR扩增16SrDNA全长,并为每一个原始扩增的16SrDNA全长加上特异的分子标签UMI,得到扩增产物;(3)将步骤(2)所得扩增产物用Tn5酶片段化并构建测序用拼接文库,并标记为A-P;(4)将步骤(2)所得扩增产物的环化连接并构建测序用连接文库,并标记为A-L;(5)将所述拼接文库A-P和连接文库A-L使用illumina测序仪测序,得到拼接文库A-P和连接文库A-L的测序结果;(6)将步骤(5)的测序结果进行生物信息技术处理分析,通过识别UMI组合的方式,在拼接文库A-P和连接文库A-L中提取数据,并组装出16SrDNA全长序列,进而比对数据库确定菌种种类。进一步地,步骤(2)进一步包括:(2.1)采用带有UMI标签的第一组引物序列对所述样本A的DNA进行第一轮PCR扩增,并进行第一次纯化步骤;(2.2)采用第二组引物序列对第一次纯化产物进行第二轮PCR扩增,并进行第二次纯化步骤。更进一步地,所述第一组引物序列如SEDIQNO:1-2所示。更进一步地,所述第二组引物序列如SEDIQNO:3-4所示。更进一步地,所述第二组引物序列的5‘端进行了磷酸化。进一步地,步骤(3)进一步包括:(3.1)将步骤(2)所得扩增产物用Tn5酶片段化;(3.2)片段化后第一轮PCR扩增并纯化,扩增引物序列如SEDIQNO:5-7所示;(3.3)对第一轮PCR扩增产物进行第二轮PCR扩增并纯化,拼接文库完成,标记为A-P,扩增引物序列如SEDIQNO:8-9所示。进一步地,步骤(4)进一步包括:(4.1)采用T4DNA连接酶完成步骤(3)最终扩增产物的环化连接,得到连接产物;(4.2)对所述连接产物进行第一轮PCR扩增并纯化,扩增引物如SEDIQNO:10-11所示;(4.2)对第一轮PCR扩增产物进行第二轮PCR扩增,扩增引物如SEDIQNO:12-13所示。进一步地,步骤(5)中使用illumina测序仪对所述A-P和A-L分别进行双端测序,测序长度为150bp。进一步地,步骤(6)进一步包括:(6.1)连接文库A-L分析:使用cutadaptor在连接文库测序结果中识别成对的UMI组合,用于在拼接文库A-L中提取数据;(6.2)拼接文库A-P分析:根据步骤(6.1)得到的成对的UMI组合,在拼接文库中提取每对UMI组合所包含的reads;(6.3)序列组装:对于每对UMI组合所包含的reads使用SPAdes组装,得到一条全长的16SrDNA序列;(6.4)序列注释:使用bowtie2将步骤(6.3)得到的16srDNA全长序列与Silva数据库进行比对,进而统计样本的菌种丰度信息。本专利技术的有益效果为:1)通用性:本专利技术的建库方法适合所有类型样本的菌群结构检测。2)准确性:本专利技术将传统的菌群结构鉴定从“属”级别提升到“种”级别,与属水平相比较,种水平的优势,可以更准确的确定环境微生物的生态结构,便于深入研究,由此可对样本进行特定细菌菌种的检测。3)高通量:基于高通量测序技术,通过在每个样品上加上不同的标签序列,可以一次地对大量样品进行分析。4)保真性:使用本专利技术检测的菌群丰度保真性好。附图说明图1是本专利技术的样本A基因组DNA的凝胶电泳图;图2是本专利技术的样本A16S全长扩增结果的凝胶电泳图;图3是本专利技术样本A的拼接文库A-P的凝胶电泳图;图4是本专利技术样本A的连接文库A-L的凝胶电泳图;图5是本专利技术样本A的菌群丰度图;图6是本专利技术实施例2中的模拟样本的菌群丰度检测结果图;图7是本专利技术实施例3中排名前20的属两种方法丰度情况对比图。具体实施方式为对本专利技术的
技术实现思路
、特点与功效有更具体的了解,现结合具体实施例,对本专利技术的技术方案做进一步详细的说明。实施例中未注明具体条件的实验方法,通常按照常规条件,或按照制造厂商所建议的调剂操作。实施例1(一)样本DNA的提取1.1本专利技术采用Qiagen的DNeasyPowerSoilKit对一例粪便样本进行提取总DNA的操作,标记为样本A。具体操作步骤:a.震荡装有3ml保护剂粪便样本的收集管,平分到2个1.5ml离心管中,2500g10min去上清,用1ml广口枪头转移沉淀到PowerBeadsTube中,轻轻涡旋混匀。b.加入60μlC1,涡旋振荡10min。c.10000g离心30s。d.转移上清到2ml收集管中。e.向收集管中加250μlC2,震荡5s,4℃孵育5min。f.10000g离心1min。g.转移600μl上清到2ml收集管中。h.加200μlC3,振荡混匀,4℃孵育5min。本文档来自技高网
...

【技术保护点】
1.一种检测细菌16S rDNA全长的建库测序方法,其特征在于,包括以下步骤:/n(1)定量提取样本中菌群的总DNA,标记为样本A;/n(2)以步骤(1)样本A的DNA为模板,通过两端带有特异分子标签UMI的引物组PCR扩增16S rDNA全长,并为每一个原始扩增的16S rDNA全长加上特异的分子标签UMI,得到扩增产物;/n(3)将步骤(2)所得扩增产物用Tn5酶片段化并构建测序用拼接文库,并标记为A-P;/n(4)将步骤(2)所得扩增产物的环化连接并构建测序用连接文库,并标记为A-L;/n(5)将所述拼接文库A-P和连接文库A-L测序,得到拼接文库A-P和连接文库A-L的测序结果;/n(6)将步骤(5)的测序结果进行生物信息技术处理分析,通过识别UMI组合的方式,在拼接文库A-P和连接文库A-L中提取数据,并组装出16S rDNA全长序列,进而比对数据库确定菌种种类。/n

【技术特征摘要】
1.一种检测细菌16SrDNA全长的建库测序方法,其特征在于,包括以下步骤:
(1)定量提取样本中菌群的总DNA,标记为样本A;
(2)以步骤(1)样本A的DNA为模板,通过两端带有特异分子标签UMI的引物组PCR扩增16SrDNA全长,并为每一个原始扩增的16SrDNA全长加上特异的分子标签UMI,得到扩增产物;
(3)将步骤(2)所得扩增产物用Tn5酶片段化并构建测序用拼接文库,并标记为A-P;
(4)将步骤(2)所得扩增产物的环化连接并构建测序用连接文库,并标记为A-L;
(5)将所述拼接文库A-P和连接文库A-L测序,得到拼接文库A-P和连接文库A-L的测序结果;
(6)将步骤(5)的测序结果进行生物信息技术处理分析,通过识别UMI组合的方式,在拼接文库A-P和连接文库A-L中提取数据,并组装出16SrDNA全长序列,进而比对数据库确定菌种种类。


2.如权利要求1所述的方法,其特征在于,步骤(2)进一步包括:
(2.1)采用带有UMI标签的第一组引物序列对所述样本A的DNA进行第一轮PCR扩增,并进行第一次纯化步骤;
(2.2)采用第二组引物序列对第一次纯化产物进行第二轮PCR扩增,并进行第二次纯化步骤。


3.如权利要求2所述的方法,其特征在于,所述第一组引物序列如SEDIQNO:1-2所示。


4.如权利要求2所述的方法,其特征在于,所述第二组引物序列如SEDIQNO:3-4所示。


5.如权利要求4所述的方法,其特征在于,所述第二组引物序列的5‘端进行了磷酸化。

<...

【专利技术属性】
技术研发人员:冯涛马伟志王震
申请(专利权)人:北京群峰纳源健康科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1