用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂技术

技术编号:23429843 阅读:25 留言:0更新日期:2020-02-25 12:21
本发明专利技术公开了一种用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂,所述方法包括:以核酸作为起始模板材料进行第一次扩增,其中正向引物由5’端至3’端依次包括公共序列、唯一分子识别标记序列以及与模板结合的序列,反向引物是目标特异性序列或非特异性序列;以第一次扩增的产物为模板进行第二次扩增,包括在各自独立体系中进行的正向文库扩增和反向文库扩增;以及以第二次扩增的产物为模板进行第三次扩增。本发明专利技术的方法将唯一分子识别标记技术与定向加正反测序接头形成正反双向文库技术结合起来,根据测序重叠部分拼接出高质量的数据,从而实现长读长测序。本发明专利技术对多种平台具有广泛的适用性,适用于单端测序和双端测序策略。

Construction method, sequencing method and reagents of nucleic acid library for long-term reading and high-quality sequencing

【技术实现步骤摘要】
用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂
本专利技术涉及测序
,尤其涉及一种用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂。
技术介绍
长PCR产物文库的高通量测序,如16SrRNA细菌鉴定、基于高通量测序的HLA分型以及免疫组库测序等,在科学研究中经常遇到。以免疫组库可变区全长文库(主峰300bp至600bp)为例,一般采用Illumina公司的PE250(Hiseq)或者PE300(Miseq)测序方式。所使用的进口测序仪器和测序试剂价格都很昂贵,购买货期较长,并且保质期较短。同时,对于PCR产物的双末端高通量测序策略而言,PE250或者PE300测序模式下的读长2(Reads2)的末端100bp质量值迅速下降(Q30从70-80%以上下降至50%以下)。而国产测序仪目前还不能做到对主峰300bp至600bp插入片段序列的高质量测序。对单末端测序来讲,能保证前300bp碱基的高质量值,Q30大于等于70%~80%,大于300bp时碱基质量值迅速下降。但是国产测序仪器和试剂价格相对便宜,货期短,因此若能开发出基于国产测序仪的长PCR产物的建库和测序策略,将具有很大竞争优势。
技术实现思路
本专利技术一种用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂。根据本专利技术的第一方面,本专利技术提供一种核酸文库的构建方法,该方法包括:(a)以DNA或RNA作为起始模板材料进行第一次扩增,上述第一次扩增中使用的引物包括正向引物和反向引物,其中上述正向引物由5’端至3’端依次包括一段公共序列、一段唯一分子识别标记序列以及一段与模板结合的序列,上述反向引物是目标特异性序列或非特异性序列;(b)以上述第一次扩增的产物为模板,进行第二次扩增,上述第二次扩增包括在各自独立体系中进行的正向文库扩增和反向文库扩增,上述正向文库扩增中使用的引物包括第一引物和第二引物,上述第一引物由5’端至3’端依次包括部分测序接头序列A和上述公共序列,上述第二引物由5’端至3’端依次包括部分测序接头序列B和目标特异性序列;上述反向文库扩增中使用的引物包括第三引物和第四引物,上述第三引物由5’端至3’端依次包括上述部分测序接头序列B和上述公共序列,上述第四引物由5’端至3’端依次包括上述部分测序接头序列A和上述目标特异性序列;以及(c)以上述正向文库扩增和反向文库扩增的产物为模板,进行第三次扩增,上述第三次扩增中使用的引物包括正向引物和反向引物,上述正向引物包括位于3’端的上述部分测序接头序列A及其上游序列,该上游序列包括用于区分样本的条形码序列,上述反向引物包括位于3’端的上述部分测序接头序列B及其上游序列。优选地,上述起始模板材料是DNA,上述第一次扩增使用的正向引物中与模板结合的序列是一段特异性序列,上述第一次扩增使用的反向引物是目标特异性序列。优选地,上述起始模板材料是RNA,上述第一次扩增使用的正向引物是模板转换寡核苷酸(TSO),上述模板转换寡核苷酸中与模板结合的序列包括位于3’端的锁核酸(LNA),上述第一次扩增使用的反向引物是随机引物或oligo-dT引物。优选地,上述模板转换寡核苷酸中与模板结合的序列包括位于3’端的核糖核苷酸残基(rN)和上述锁核酸(LNA);更优选地,上述核糖核苷酸残基是核糖鸟嘌呤(rG),上述锁核酸是锁鸟嘌呤(+G),最优选地,上述与模板结合的序列包括位于3’端的rGrGrG+G。优选地,上述核酸文库是PCR产物文库,优选地,PCR产物文库是免疫组库全长文库,更优选地,上述免疫组库全长文库的主峰是300bp至600bp。优选地,上述核酸文库适用于Illumina、IonTorrent、BGIseq或MGIseq测序平台,更优选BGIseq测序平台。根据本专利技术的第二方面,本专利技术提供一种由第一方面的核酸文库的构建方法构建得到的核酸文库。根据本专利技术的第三方面,本专利技术提供一种测序方法,该方法包括:根据第一方面的核酸文库的构建方法构建核酸文库;对上述核酸文库进行测序。根据本专利技术的第四方面,本专利技术提供一种用于构建核酸文库的引物组合,该引物组合包括:用于以DNA或RNA作为起始模板材料进行第一次扩增的正向引物,上述正向引物由5’端至3’端依次包括一段公共序列、一段唯一分子识别标记序列以及一段与模板结合的序列,该与模板结合的序列是特异性序列;或上述正向引物是模板转换寡核苷酸(TSO),上述模板转换寡核苷酸由5’端至3’端依次包括一段公共序列、一段唯一分子识别标记序列以及一段与模板结合的序列,该与模板结合的序列包括位于3’端的锁核酸(LNA)。优选地,上述引物组合还包括:用于以DNA或RNA作为起始模板材料进行第一次扩增的反向引物,该反向引物是目标特异性序列或非特异性序列。优选地,上述引物组合还包括:用于以上述第一次扩增的产物为模板进行第二次扩增的引物,其包括正向文库扩增引物和反向文库扩增引物,上述正向文库扩增引物包括第一引物和第二引物,上述第一引物由5’端至3’端依次包括部分测序接头序列A和上述公共序列,上述第二引物由5’端至3’端依次包括部分测序接头序列B和目标特异性序列;上述反向文库扩增引物包括第三引物和第四引物,上述第三引物由5’端至3’端依次包括上述部分测序接头序列B和上述公共序列,上述第四引物由5’端至3’端依次包括上述部分测序接头序列A和上述目标特异性序列;以及用于以上述第二次扩增的产物为模板进行第三次扩增的引物,其包括正向引物和反向引物,上述正向引物包括位于3’端的上述部分测序接头序列A及其上游序列,该上游序列包括用于区分样本的条形码序列,上述反向引物包括位于3’端的上述部分测序接头序列B及其上游序列。本专利技术的建库方法将唯一分子识别标记(UMI)技术与PCR产物定向加正反测序接头形成正反双向文库技术结合起来,根据正反双向文库的测序重叠部分拼接出高质量(Q30>77%)的主峰(300bp至1000bp,优选300bp至600bp),从而实现长读长测序,其中UMI用于同一样本的正反双向文库测序数据拼接。本专利技术能够显著降低测序成本。此外,本专利技术对多种平台具有广泛的适用性,且同时适用于单端测序和双端测序策略。附图说明图1为本专利技术示例性的核酸文库的构建方法流程图以及测序结果拼接原理示意图。图2本专利技术一个实施例中测序得到的两个正反向文库的结构示意图。具体实施方式下面将更详细地描述本专利技术的用于长读长高质量测序的核酸文库的构建方法、测序方法及试剂。除非另外定义,否则详述中使用的技术和科学术语具有与本专利
的技术人员理解相同的含义。本专利技术中,术语―长读长”是指主峰在300bp以上的文库,例如300bp至1000bp,优选300bp至600bp,这样的核酸文库包括但不限于16SrRNA细菌鉴定、基于高通量测序的HLA分型以及免疫组库测序文库,尤其是免疫组库全长文库,优选地,免疫组库全长文库的主峰是300bp至600本文档来自技高网
...

【技术保护点】
1.一种核酸文库的构建方法,其特征在于,所述方法包括:/n(a)以DNA或RNA作为起始模板材料进行第一次扩增,所述第一次扩增中使用的引物包括正向引物和反向引物,其中所述正向引物由5’端至3’端依次包括一段公共序列、一段唯一分子识别标记序列以及一段与模板结合的序列,所述反向引物是目标特异性序列或非特异性序列;/n(b)以所述第一次扩增的产物为模板,进行第二次扩增,所述第二次扩增包括在各自独立体系中进行的正向文库扩增和反向文库扩增,所述正向文库扩增中使用的引物包括第一引物和第二引物,所述第一引物由5’端至3’端依次包括部分测序接头序列A和所述公共序列,所述第二引物由5’端至3’端依次包括部分测序接头序列B和目标特异性序列;所述反向文库扩增中使用的引物包括第三引物和第四引物,所述第三引物由5’端至3’端依次包括所述部分测序接头序列B和所述公共序列,所述第四引物由5’端至3’端依次包括所述部分测序接头序列A和所述目标特异性序列;以及/n(c)以所述正向文库扩增和反向文库扩增的产物为模板,进行第三次扩增,所述第三次扩增中使用的引物包括正向引物和反向引物,所述正向引物包括位于3’端的所述部分测序接头序列A及其上游序列,该上游序列包括用于区分样本的条形码序列,所述反向引物包括位于3’端的所述部分测序接头序列B及其上游序列。/n...

【技术特征摘要】
1.一种核酸文库的构建方法,其特征在于,所述方法包括:
(a)以DNA或RNA作为起始模板材料进行第一次扩增,所述第一次扩增中使用的引物包括正向引物和反向引物,其中所述正向引物由5’端至3’端依次包括一段公共序列、一段唯一分子识别标记序列以及一段与模板结合的序列,所述反向引物是目标特异性序列或非特异性序列;
(b)以所述第一次扩增的产物为模板,进行第二次扩增,所述第二次扩增包括在各自独立体系中进行的正向文库扩增和反向文库扩增,所述正向文库扩增中使用的引物包括第一引物和第二引物,所述第一引物由5’端至3’端依次包括部分测序接头序列A和所述公共序列,所述第二引物由5’端至3’端依次包括部分测序接头序列B和目标特异性序列;所述反向文库扩增中使用的引物包括第三引物和第四引物,所述第三引物由5’端至3’端依次包括所述部分测序接头序列B和所述公共序列,所述第四引物由5’端至3’端依次包括所述部分测序接头序列A和所述目标特异性序列;以及
(c)以所述正向文库扩增和反向文库扩增的产物为模板,进行第三次扩增,所述第三次扩增中使用的引物包括正向引物和反向引物,所述正向引物包括位于3’端的所述部分测序接头序列A及其上游序列,该上游序列包括用于区分样本的条形码序列,所述反向引物包括位于3’端的所述部分测序接头序列B及其上游序列。


2.根据权利要求1所述的核酸文库的构建方法,其特征在于,所述起始模板材料是DNA,所述第一次扩增使用的正向引物中与模板结合的序列是一段特异性序列,所述第一次扩增使用的反向引物是目标特异性序列。


3.根据权利要求1所述的核酸文库的构建方法,其特征在于,所述起始模板材料是RNA,所述第一次扩增使用的正向引物是模板转换寡核苷酸(TSO),所述模板转换寡核苷酸中与模板结合的序列包括位于3’端的锁核酸(LNA),所述第一次扩增使用的反向引物是随机引物或oligo-dT引物。


4.根据权利要求3所述的核酸文库的构建方法,其特征在于,所述模板转换寡核苷酸中与模板结合的序列包括位于3’端的核糖核苷酸残基(rN)和所述锁核酸(LNA);优选地,所述核糖核苷酸残基是核糖鸟嘌呤(rG),所述锁核酸是锁鸟嘌呤(+G),更优选地,所述与模板结合的序列包括位于3’端的rGrGrG+G。


5.根据权利要求1-4任一项所述的核酸文库的构建方法,其特征在于,所述...

【专利技术属性】
技术研发人员:杨乃波李新洋项海涛廖莎徐崇钧许军强
申请(专利权)人:深圳华大生命科学研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1