一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法技术

技术编号:17538443 阅读:769 留言:0更新日期:2018-03-24 12:34
本发明专利技术公开了一种用于构建16S rRNA基因扩增子测序文库的四重标签引物组,所述四重标签引物组由第一步PCR两重标签引物对和第二步PCR两重标签引物对组成;所述第一步PCR两重标签引物对的上游引物的序列为SEQ ID NO:1~8中的任一条,下游引物的序列为SEQ ID NO:9~20中的任一条;所述第二步PCR两重标签引物对的上游引物的序列为SEQ ID NO:21~44中的任一条,下游引物的序列为SEQ ID NO:45~68中的任一条。本发明专利技术所提供的四重标签引物组中增加了平衡碱基序列,增加了文库多样性,提高了测序质量,在上机测序时仅需混合少量PhiX文库,并进行错位测序,减少了测序通量的浪费,保证了测序质量。

A primer group and construction method for the construction of the 16SrRNA gene amplifer sequencing Library

The invention discloses a method for constructing four tag primer group 16S rRNA gene amplicon sequencing library for the four tag primer set by the first step PCR double label primer pairs and second step PCR double tag primer on the upstream primer sequence; PCR is the first step of the dual tag primer for SEQ ID NO:1 ~ 8 in any sequence, downstream primer SEQ ID NO:9 ~ 20 in any one; the second step sequence upstream primer PCR double label primer pairs for SEQ ID NO:21 ~ 44 in any sequence, for any downstream primer 68 SEQ NO:45 ~ ID. Increase the balance sequence provided by the invention four tag primer set, increase the library diversity, improve the quality of sequencing, only a small amount of PhiX in the hybrid library sequencing, sequencing and sequencing to reduce dislocation, flux waste, ensure the quality of sequencing.

【技术实现步骤摘要】
一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法
本专利技术涉及微生物基因高通量测序
,具体地,涉及一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法。
技术介绍
随着测序技术的不断改进,微生物基因高通量测序技术已日趋成熟。扩增子测序是一种对保存有生物遗传信息的多态性基因区域(如16S、18S、ITS基因)的靶向测序方法,在建库过程中,需要先对目标区域进行靶标扩增,然后再对PCR产物进行建库测序。16SrRNA测序能较低成本地对多样本微生物物种群落组成进行评估,几乎不受宿主基因组污染影响,但也存在以下不足:(1)测序信息量区域较少,在具有生物意义的信息识别和解释上存在不足;(2)在测序实验前需要靶标PCR扩增和多样品混合建库,易引入实验因素导致的结果偏差;(3)双区或多区的扩增子测序区域较长,而生物分析上要求单条序列一次性测通,不能进行实验打断,因此对测序平台的选择较为局限,目前满足双端测序的仪器仅有illunimaHiseq2500和illunimaMiseq;(4)微生物扩增子文库测序的都为统一基因的区域,文库片段长、多样性低,常导致测序数据低质量,目前的两大主流平台,光学系统的illunima平台和半导体系统的IonTorrent平台测序都面临着硬件挑战。为了解决16SrRNA基因扩增子测序在准确性、成本、样品吞吐量、数据质量等方面的问题,以促进对复杂微生物群落的研究,研究者所做的工作主要体现在以下三方面:(1)16SrRNA高突变区选择:对于常规环境、人体组织微生物样本选择16SrRNAV4区作为靶标的最多,其单区分辨率最高,但却只能获得单区信息;最早的长读长测序仪罗氏454平台曾多次发表针对V1~V3区的文章,但现已退出市场,目前的测序仪无法达到一次测通V1~V3区的600bp以上;目前有众多研究者采用高可变区V3、V4区进行搭配使用,但是V3~V4区位点为314~806,长度约500~550bp,目前仅有MiseqPE300测序类型能满足测序要求,且常常面临着长读长reads3’测序末端质量低下,导致read1和read2无法拼接,数据报废的风险;经研究者长期的验证,V4~V5区与V3~V4具有同样的高可变区分辨率,特别适合于常规环境、人体组织微生物样本,能鉴定到属或种。V4~V5的位点为515~907,长度约392bp,可广泛适用于通量较大、成本低的illuminahiseq2500PE250平台,和速度快、FDA认证具有临床产品开发意义的illumiaMiSeqPE300测序平台。(2)建库策略方面:16S扩增子测序常采用对多个样品加标签进行混池建库的方法进行测序,目前主流方法主要有PCR产物建库法、一步扩增法和两步扩增法。其中,PCR产物建库法:使用5’端或3’端的单端或双端含有约6~8bp的标签(index)的靶标的通用引物对基因组进行扩增,纯化靶标扩增产物,使用Qubit或qPCR方法进行定量,将约20~40个样本等量混合后进行构建一个普通DNA文库,此法引物较短,PCR扩增的保真效果好,但实验步骤繁琐,且需要经过多步的DNA建库环节,时间长、成本高。一步扩增法:使用含带有标签的单链测序接头和通用引物一起合成,在靶标扩增的同时,将PCR产物带上测序所需要的接头,即可直接得到文库,操作简便、速度快、成本低,但带上完整测序接头的单条引物长达90bp,在PCR扩增环节容易导致扩增效率低(如扩增失败,总量偏低),出现引物二聚体、杂带,甚至会导致数据分析时的样品失真,目前关于一步扩增法的研究虽然较多,但均不能有效解决该问题。两步扩增法:使用5’端和3’端含有部分单链接头序列的通用引物进行第一步PCR扩增,然后对第一步能成功特异扩增的产物,使用含有标签和完整单链接头的引物进行第二步扩增,即可得到文库,此两步法不需要普通DNA文库构建、速度快、成本低、方便不同样品间灵活混池、个别样品灵活补测。两步法的引物设计组合最多,如标签的数量、位置,部分单链接头序列的长度、第二步PCR接头的长度等,会导致不同使用者对建库效果的偏差,如引物设计和实验反应条件不适当,两轮PCR会导致扩增偏好,扩增错误放大。(3)实验反应参数:实验参数与样本类型、建库策略、实验室试剂偏好有关,需组合出一套适合特定实验的参数。除上述三方面外,降低成本和大规模测序往往还存在一个扩增子文库多样性低的上机问题。常规使用平台Hiseq2500和MiSeq的微生物扩增子文库,基因不同区域因读长跨度大,影响文库定量,因而不能混合上机,只能采取扩增子单一基因单一区域扩增,显得文库复杂度极低。如illunima测序前5个循环,测序的四种碱基不接近25%,否则会导致测序失败;测序过程中,某个测序长度位点只测到单一碱基,因荧光信息号无强弱对比,会导致测序质量低下;需加入25~50%的PhiX平衡文库,但其存在会极大的浪费测序通量。因此,针对上述问题,迫切需要对现有的16SrRNA基因扩增子测序文库构建方法进行优化改进,解决序列碱基复杂度低等问题,以提供一种高效快捷、准确灵活、低成本、满足大规模样品的16SrRNA基因扩增子测序文库构建的方法。
技术实现思路
本专利技术为了克服现有技术的上述不足,提供一种用于构建16SrRNA基因扩增子测序文库的四重标签引物组,充分利用二代测序技术的特点,和微生物群落组成的扩增子文库特征,突破测序平台固有的限制,以解决序列碱基复杂度低等问题。本专利技术的另一目的在于提供上述任一所述四重标签引物组在构建16SrRNA基因可变区V4~V5区扩增子测序文库中的应用。本专利技术的另一目的在于提供一种构建16SrRNA基因扩增子测序文库的方法。为了实现上述目的,本专利技术是通过以下方案予以实现的:一种用于构建16SrRNA基因扩增子测序文库的四重标签引物组,所述四重标签引物组由第一步PCR两重标签引物对和第二步PCR两重标签引物对组成;所述第一步PCR两重标签引物对的上游引物的序列为SEQIDNO:1~8中的任一条,下游引物的序列为SEQIDNO:9~20中的任一条;所述第二步PCR两重标签引物对的上游引物的序列为SEQIDNO:21~44中的任一条,下游引物的序列为SEQIDNO:45~68中的任一条;所述第一步PCR两重标签引物对中的N和V代表由0~6个碱基组成的平衡碱基;其中,N选自以下7种上游平衡碱基中的任一种,V选自以下7种下游平衡碱基中的任一种:序号上游平衡碱基(5’-3’)下游平衡碱基(5’-3’)1空白空白2TA3GTTC4CGACTA5TGTAGATG6TGCGATCTCA7GAGTGGTTCTCT本专利技术以两步PCR法为建库策略,结合靶标基因的序列特点,设计了四重标签引物组,所述第一步PCR两重标签引物对由PCR1上游引物和PCR1下游引物组成,按照5’端至3’端的顺序包括PCR1接头序列、PCR1标签序列、平衡碱基序列、靶标引物。每个样品靶标片段测序前有49种平衡碱基组合方式,以改变不同样品的文库间测序起点,极大地增加测序每个Cycles的碱基均一性和复杂度。所述PCR1标签序列由8个碱基组成,标签间不能有连续3个以上的碱基相同,且要求各碱基比例接近25%;优选地,所述PCR1标签序列本文档来自技高网
...
一种用于构建16SrRNA基因扩增子测序文库的引物组及构建方法

【技术保护点】
一种用于构建16S rRNA基因扩增子测序文库的四重标签引物组,其特征在于,所述四重标签引物组由第一步PCR两重标签引物对和第二步PCR两重标签引物对组成;所述第一步PCR两重标签引物对的上游引物的序列为SEQ ID NO:1~8中的任一条,下游引物的序列为SEQ ID NO:9~20中的任一条;所述第二步PCR两重标签引物对的上游引物的序列为SEQ ID NO:21~44中的任一条,下游引物的序列为SEQ ID NO:45~68中的任一条;所述第一步PCR两重标签引物对中的N和V代表由0~6个碱基组成的平衡碱基;其中,N选自以下7种上游平衡碱基中的任一种,V选自以下7种下游平衡碱基中的任一种:

【技术特征摘要】
1.一种用于构建16SrRNA基因扩增子测序文库的四重标签引物组,其特征在于,所述四重标签引物组由第一步PCR两重标签引物对和第二步PCR两重标签引物对组成;所述第一步PCR两重标签引物对的上游引物的序列为SEQIDNO:1~8中的任一条,下游引物的序列为SEQIDNO:9~20中的任一条;所述第二步PCR两重标签引物对的上游引物的序列为SEQIDNO:21~44中的任一条,下游引物的序列为SEQIDNO:45~68中的任一条;所述第一步PCR两重标签引物对中的N和V代表由0~6个碱基组成的平衡碱基;其中,N选自以下7种上游平衡碱基中的任一种,V选自以下7种下游平衡碱基中的任一种:序号上游平衡碱基(5’-3’)下游平衡碱基(5’-3’)1空白空白2TA3GTTC4CGACTA5TGTAGATG6TGCGATCTCA7GAGTGGTTCTCT2.权利要求1所述四重标签引物组在构建16SrRNA基因可变区V4~V5区扩增子测序文库中的应用。3.一种构建16SrRNA基因扩增子测序文库的方法,其特征在于,包括以下步骤:S1.待测样本基因组提取与质量控制;S2.第一步PCR反应:以S1的待测样本基因组为模板,利用权利要求1所述的第一步PCR两重标签引物对进行PCR扩增反应并检测扩增产物,选取在480bp左右有单一条带的扩增产物进行下一步反应;S3.第二步PCR反应:以S2中选取的扩增产物为模板,利用权利要求1所述的第二步PCR两重标签引物对进行PCR扩增反应并检测扩增产物,选取在551bp左右有单一条带的扩增产...

【专利技术属性】
技术研发人员:伍泳彰陈杰
申请(专利权)人:广州赛哲生物科技股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1