一种用于构建细菌16S rDNA全长高通量测序文库的方法技术

技术编号:21597661 阅读:45 留言:0更新日期:2019-07-13 15:50
本发明专利技术涉及一种用于构建细菌16S rDNA全长高通量测序文库的方法,涉及微生物高通量测序领域。该方法首先将随机碱基组成的特异性标签序列(UMI)加在每个16S rDNA模板分子两端,经PCR扩增得到多个拷贝的两端含特定UMI的16S rDNA全长扩增子,通过随机打断并连接上测序文库的接头,经双端测序获得UMI序列和相应的16S rDNA片段序列;另外,通过环化16S rDNA全长扩增子和测序,获得同一分子两端的UMI配对信息;根据相同UMI和配对UMI信息进行reads的组装,从而增加拼接长度,最终组装得到16S rDNA全长序列信息。本发明专利技术提供的方法成本低、准确度高,适用于高通量测序平台;同时该方法通过UMI可有效排除PCR扩增偏好性、扩增错误和测序错误的影响,从而更加精确地定量样本中的细菌种群丰度。

A Method for Construction of Bacterial 16S rDNA Full-length and High-throughput Sequencing Library

【技术实现步骤摘要】
一种用于构建细菌16SrDNA全长高通量测序文库的方法
本专利技术属于微生物基因高通量测序领域,具体涉及一种用于构建细菌16SrDNA全长高通量测序文库的方法。
技术介绍
16S核糖体核糖核酸(ribosomalRNA,rRNA)为核糖体的RNA的一个亚基,16SrDNA是编码该亚基的基因,存在于所有细菌基因组中,长度约为1.5Kb,其分子大小适中,突变率小,是细菌系统分类学研究中最常用和最有用的标志。16SrDNA包括9个可变区和10个保守区,保守区序列反映了物种间的亲缘关系,而可变区序列则能体现物种间的差异。16SrDNA常用于研究特定环境中的物种信息,包括物种差异、物种分类和物种丰度等,对复杂环境中的微生物构成研究有重要的指导作用。几十年来,16SrDNA已被广泛应用于分类学和系统发育关系的确定。16S扩增子测序即通过提取环境样品的基因组DNA,选择合适的通用引物扩增16SrDNA某一或某几个区,通过测序检测目的区域的序列变异和丰度,对环境样本的物种分类、丰度、种群结构、系统进化、群落比较等信息进行分析的研究方法。16SrDNA在细菌的基因组中存在多个拷贝,不同属的16SrDNA拷贝数不同,同一个属内有些种的16SrDNA拷贝数也可能存在差异。DNA的提取、引物的选择、PCR扩增以及测序方法的不同都可能会影响最终结果的偏好性。比如,在使用同一对引物扩增16s基因的可变区域时,无法保证对不同细菌16SrDNA序列的扩增效率是一致的。如果第一轮扩增对目标片段有些微偏好性,第二轮扩增时会指数式放大PCR对片段的扩增偏好性。这种扩增偏好性可能导致分析结果偏离真实的微生物种群的组成。尽管二代测序的错误率很低(例如,Illumina的错误率约0.1%),但测序错误仍然会导致一些不真实的序列多样性。因此,如何能够在测序结果中排除扩增错误和测序错误,直接反应出样本中原始模板分子的基因序列尤为重要。DNA测序技术的进步使我们能够更好的研究不同环境下的复杂微生物的动态组成,但由于目前高通量测序平台读长的限制,只能对16SrDNA的某一段可变区进行测序,常见的有测单V区(V3/V4/V6)、测双V区(V3-V4区或V4-V5区)或测三V区(V1-V3区、V5-V7区或V7-V9区)。但全长测序更有优势,目前16SrDNA全长的测序主要采用三代测序,如Pacbio平台测序,其优点是读长较长,可以获取16SrDNA全长的序列信息,缺点是测序成本高且通量小。因此,现有的细菌16SrDNA全长的建库测序方法仍需进一步改进,以便适用于多种高通量测序平台,如HiSeqXTen、HiSeq4000、NextSeq500等,以有效降低测序成本;此外也需要尽量排除PCR扩增偏好性、扩增错误和测序错误的影响,更加精确地定量细菌种群丰度。
技术实现思路
本专利技术的目的是提供一种用于构建细菌16SrDNA全长高通量测序文库的方法,可以适用于多种高通量测序平台,能有效降低测序成本,同时可有效去除PCR扩增偏好性、扩增错误和测序错误的影响,更加精确地定量细菌种群丰度。本专利技术采用的技术方案如下:一种用于构建细菌16SrDNA全长高通量测序文库的方法,其特征在于,包括以下步骤:1)提取样本中的细菌基因组DNA:采集环境样本,提取样本中的细菌基因组DNA;2)在每个16SrDNA模板分子两端分别加上不同的UMI标记:首先经过两轮独立的退火、延伸步骤,将随机碱基组成的特异性标签序列(UniqueMolecularIdentifier,UMI)加在每个16SrDNA模板分子两端,然后经PCR扩增得到多个拷贝的两端含不同UMI标记的16SrDNA全长扩增子;3)构建16SrDNA全长文库:包括含单端UMI序列的文库和含双端UMI序列的文库的构建;3a)构建含单端UMI序列的文库:将步骤2)得到的16SrDNA全长扩增子,使用含P7序列和生物素(Biotin)修饰的上下游引物进行PCR扩增,得到两端含P7序列且含Biotin修饰的产物,将产物进行随机片段化并切胶回收500~1000bp的DNA片段,特异性富集含Biotin标记的DNA片段,进行末端缺口补齐修复,并将修复的DNA片段的3’端加上脱氧腺苷酸A,并与3’端带有突出的脱氧胸苷酸T的P5接头连接,经PCR扩增后,纯化回收产物,即得到含单端UMI序列的文库,其结构特点是含左端UMI和16SrDNA中间序列的片段,或含右端UMI和16SrDNA中间序列的片段;3b)构建含双端UMI序列的文库:将步骤2)得到的16SrDNA全长扩增子,在3’端加上脱氧腺苷酸A,并与含biotin修饰且3’端带有突出“T”碱基的接头连接,经环化反应形成含biotin修饰的环状DNA分子;在DNA外切酶的作用下,去掉未环化的DNA分子;将环状DNA产物随机打断得到300-1000bp的DNA片段,特异性富集含Biotin标记的DNA片段,通过末端修复、加A、加标签接头、PCR扩增,即得到含双端UMI序列的文库,其结构特点是包含左右两端UMI序列的配对信息;3c)将步骤3a)和3b)得到的含单端UMI序列的文库和含双端UMI序列的文库按照一定的质量比进行混合,即为待测的16SrDNA全长文库;4)高通量测序:将16SrDNA全长文库在高通量测序平台进行测序,测序类型为2×150bp的双端测序;5)生物信息分析:将测序数据进行过滤质控、根据UMI信息进行数据拆分、序列拼接、OTU聚类和注释、组内组间统计比较分析,多角度度量样本的微生物群落特征。本专利技术首先将随机碱基组成的特异性标签序列(UniqueMolecularIdentifier,UMI)加在每个16SrDNA模板分子两端,然后经PCR扩增得到多个拷贝的两端含特定UMI的16SrDNA分子,这些扩增子片段通过随机打断并连接上测序文库的接头,通过双端测序(Pair-end,PE),获得UMI的序列和相应的16SrDNA中的序列;另外,通过环化全长的16SrDNA片段和测序,获得同一分子两端的UMI配对信息;根据相同UMI和配对UMI信息进行reads的组装,从而增加拼接长度,最终组装得到16SrDNA全长序列信息。本专利技术所述的环境样本,包括自然环境和体内环境,其中自然环境包括土壤、海洋、河流环境等;体内环境包括口腔环境和肠道环境等。进一步地,步骤2)所述的UMI标记是由8~12个随机碱基N构成的序列,每一个随机碱基N选自A、T、C、G中的任意一个碱基。通过步骤2)两轮独立的解链、退火和延伸反应依次在16SrDNA分子的左端和右端分别加上UMI标记,以达到在每个16SrDNA模板分子两端加上不同UMI的目的。步骤2)所述的细菌基因组DNA起始量为50~500pg。进一步地,步骤3a)中随机片段化方法包括超声片段化或酶切处理,以达到将DNA片段随机打断的目的。步骤3a)所指的Biotin修饰,为合成引物时在引物的其中一个碱基(例如5’末端碱基)上进行的生物素修饰。步骤3b)中通过环化反应将同一16SrDNA全长分子两端的特定UMI进行配对,从而得到来自同一底物分子两端的UMI对信息。步骤3b)中Biotin修饰,是指合成引物时在引物的其中一个碱基(例如中间T碱基)上进行的生物素本文档来自技高网
...

【技术保护点】
1.一种用于构建细菌16S rDNA全长高通量测序文库的方法,其特征在于,包括以下步骤:1)提取样本中的细菌基因组DNA:采集环境样本,提取样本中的细菌基因组DNA;2)在每个16S rDNA模板分子两端分别加上不同的UMI标记:首先经过两轮独立的退火、延伸步骤,将随机碱基组成的特异性标签序列(Unique Molecular Identifier,UMI)加在每个16S rDNA模板分子两端,然后经PCR扩增得到多个拷贝的两端含不同UMI标记的16S rDNA全长扩增子;3)构建16S rDNA全长文库:包括含单端UMI序列的文库和含双端UMI序列的文库的构建;3a)构建含单端UMI序列的文库:将步骤2)得到的16S rDNA全长扩增子,使用含P7序列和生物素(Biotin)修饰的上下游引物进行PCR扩增,得到两端含P7序列且含Biotin修饰的产物,将产物进行随机片段化并切胶回收500~1000bp的DNA片段,特异性富集含Biotin标记的DNA片段,进行末端缺口补齐修复,并将修复的DNA片段的3’端加上脱氧腺苷酸A,并与3’端带有突出的脱氧胸苷酸T的P5接头连接,经PCR扩增后,纯化回收产物,即得到含单端UMI序列的文库,其结构特点是含左端UMI和16S rDNA中间序列的片段,或含右端UMI和16S rDNA中间序列的片段;3b)构建含双端UMI序列的文库:将步骤2)得到的16S rDNA全长扩增子,在3’端加上脱氧腺苷酸A,并与含biotin修饰且3’端带有突出“T”碱基的接头连接,经环化反应形成含biotin修饰的环状DNA分子;在DNA外切酶的作用下,去掉未环化的DNA分子;将环状DNA产物随机打断得到300‑1000bp的DNA片段,特异性富集含Biotin标记的DNA片段,通过末端修复、加A、加标签接头、PCR扩增,即得到含双端UMI序列的文库,其结构特点是包含左右两端UMI序列的配对信息;3c)将步骤3a)和3b)得到的含单端UMI序列的文库和含双端UMI序列的文库按照一定的质量比进行混合,即为待测的16S rDNA全长文库;4)高通量测序:将16S rDNA全长文库在高通量测序平台进行测序,测序类型为2×150bp的双端测序;5)生物信息分析:将测序数据进行过滤质控、根据UMI信息进行数据拆分、序列拼接、OTU聚类和注释、组内组间统计比较分析,多角度度量样本的微生物群落特征。...

【技术特征摘要】
1.一种用于构建细菌16SrDNA全长高通量测序文库的方法,其特征在于,包括以下步骤:1)提取样本中的细菌基因组DNA:采集环境样本,提取样本中的细菌基因组DNA;2)在每个16SrDNA模板分子两端分别加上不同的UMI标记:首先经过两轮独立的退火、延伸步骤,将随机碱基组成的特异性标签序列(UniqueMolecularIdentifier,UMI)加在每个16SrDNA模板分子两端,然后经PCR扩增得到多个拷贝的两端含不同UMI标记的16SrDNA全长扩增子;3)构建16SrDNA全长文库:包括含单端UMI序列的文库和含双端UMI序列的文库的构建;3a)构建含单端UMI序列的文库:将步骤2)得到的16SrDNA全长扩增子,使用含P7序列和生物素(Biotin)修饰的上下游引物进行PCR扩增,得到两端含P7序列且含Biotin修饰的产物,将产物进行随机片段化并切胶回收500~1000bp的DNA片段,特异性富集含Biotin标记的DNA片段,进行末端缺口补齐修复,并将修复的DNA片段的3’端加上脱氧腺苷酸A,并与3’端带有突出的脱氧胸苷酸T的P5接头连接,经PCR扩增后,纯化回收产物,即得到含单端UMI序列的文库,其结构特点是含左端UMI和16SrDNA中间序列的片段,或含右端UMI和16SrDNA中间序列的片段;3b)构建含双端UMI序列的文库:将步骤2)得到的16SrDNA全长扩增子,在3’端加上脱氧腺苷酸A,并与含biotin修饰且3’端带有突出“T”碱基的接头连接,经环化反应形成含biotin修饰的环状DNA分子;在DNA外切酶的作用下,去掉未环化的DNA分子;将环状DNA产物随机打断得到300-1000bp的DN...

【专利技术属性】
技术研发人员:陈祖耕毕书琳王成
申请(专利权)人:杭州进一生物科技有限公司
类型:发明
国别省市:浙江,33

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1