一种靶向富集高GC含量目标DNA的方法和试剂盒技术

技术编号:21109298 阅读:26 留言:0更新日期:2019-05-16 05:44
本发明专利技术涉及一种基于目标序列捕获和多重置换扩增的靶向富集高GC含量目标DNA的方法以及适于该方法的试剂盒。本发明专利技术还涉及基于该富集方法构建高GC含量DNA测序文库的方法。

A Targeted Enrichment Method and Kit for Target DNA with High GC Content

The invention relates to a method for targeting and enriching target DNA with high GC content based on target sequence capture and multiple displacement amplification, and a kit suitable for the method. The invention also relates to a method for constructing DNA sequencing library with high GC content based on the enrichment method.

【技术实现步骤摘要】
一种靶向富集高GC含量目标DNA的方法和试剂盒
本专利技术涉及针对高GC含量目标DNA的富集方法,该方法尤其适用于高GC含量序列的测序文库的构建,例如在高通量、长读长的测序方法中所用的测序文库。本专利技术还涉及用于上述方法的试剂盒。技术背景基因组中富含GC的区域往往与基因表达的调控、染色体结构的变化以及遗传病等都有着密切的关系[1]。由于高GC区的G-C碱基互补配对形成的发夹状二级结构较为稳定,对高GC含量DNA区域(一般GC含量等于或大于80%)的准确测序一直以来存在技术上的困难和挑战。虽然以Sanger测序、毛细管电泳等为代表的方法当前在高GC含量DNA的检测中被使用[2,3],但这些方法基本上都是建立在聚合酶链式反应(PCR)的基础之上的,而PCR往往难以对高GC含量DNA,特别是完全由C/G碱基组成的区域进行有效扩增[4]。尽管人们已在改造DNA聚合酶、优化引物设计、优化PCR反应温控条件、使用能够减少DNA二级结构的PCR促进剂(如二甲基亚砜、甜菜碱等)等多个方面做出了努力,并且一定程度上也提高了高GC含量DNA的扩增效率[5-8],但结果并不是十分稳定,因为扩增效果往往取决于DNA模板分子序列和组成的复杂程度。此外,即便是通过PCR扩增获得了高GC含量DNA的少量产物并用高分辨率的毛细管电泳进行检测,该方法也只能检测产物的大小和丰度,无法获得DNA的碱基序列;而能读取DNA序列的Sanger测序技术和第二代高通量测序技术仍然都是基于PCR原理进行的,对高GC区的测序依然存在无法准确读取,甚至测序过程中断等诸多问题。综上,针对高GC含量DNA序列的检测主要包括两个方面的技术关键:(1)高GC目标区域的靶向建库或富集;(2)高GC目标区域的测序。先前Loomis等人已经采用单分子实时测序(SMRT)技术对含有高达750个CGG重复单元的目标DNA序列进行了测序[9];这得益于近年来发展的以单分子实时测序和纳米孔测序为主要代表的第三代高通量测序技术的诸多优势,其不仅能够读取更长的读长,而且测序过程无需PCR环节即可对单分子直接进行测序,避免了因PCR而导致的高GC区域测序的限制,真正实现测序覆盖的完整性[10]。然而,Loomis等人方法中用于测序的高GC含量目标DNA,是通过克隆质粒和PCR扩增两种方式获得的[9],克隆质粒的方法费时费力,而PCR扩增依然也面临扩增效率低和扩增错误倾向的问题。此外,Pham等人最近也报道了一种不依赖于扩增或富集的方式对高GC目标DNA进行三代测序的方法:用IIS型限制性内切酶处理基因组DNA,然后连接含特异序列的发夹状接头,再经核酸外切酶处理保留含完整接头连接DNA的分子,最后用含特异序列的SMRThook引物进行靶向测序[11]。但是,Pham等的这个方法[11]也存在几个明显的问题,例如:Pham等人所用的限制性内切酶[11]消化后片段的长度一般是几百个碱基,对较长片段(如kb级以上的)目标DNA的连续测序可能会存在一定的困难;而且该方法因未有模板DNA的富集或扩增过程,所以对起始DNA的含量要求较多。鉴于第三代测序平台可以很轻松且准确地对高GC含量DNA进行测序[10],那么现在需要解决的问题主要是如何准确高效地靶向富集从而获得满足测序平台要求的高GC含量的目标DNA。靶向富集首先需完成目标区域的定向分离,而现在比较成熟的目标序列捕获技术,可根据基因组目标区域的序列设计合成特异性探针与基因组DNA杂交,从而实现目标序列的定向分离[12]。因为通过探针杂交捕获到的产物是单链DNA,所以需要通过技术手段将其转化成可以建库测序的双链DNA并扩增富集。而多重置换扩增(multipledisplacementamplification,MDA)技术运用具有链置换活性的DNA聚合酶可完成模板DNA的恒温高效、超长扩增[13],更重要的是MDA技术对高GC区同样可准确高效扩增(图1),可实现高GC含量目标DNA的有效富集并得到双链DNA。因此,本专利技术结合目标序列捕获技术可定向分离目标区域的特点和MDA技术能对高GC区域有效扩增的优势,提供了一种基于目标区域捕获和多重置换扩增技术的靶向富集高GC含量DNA的方法和试剂盒。本专利技术进一步提供基于上述靶向富集方法的适于长读长测序平台的文库构建方法,所述长读长测序包括,但不限于,单分子实时测序(SMRT)技术和纳米孔测序技术。
技术实现思路
本专利技术的目的在于解决现有技术中高GC含量序列难以用PCR有效扩增从而导致难以准确测序的问题,提供了一种基于目标区域捕获和多重置换扩增技术的靶向富集高GC含量DNA片段的方法和试剂盒。采用该方法和试剂盒对高GC含量的目标区域进行靶向富集,可避免传统富集方法中因采用PCR扩增所导致的扩增效率低甚至失败以及非特异性扩增的问题,可获得分子长度不小于2kb的DNA片段,适于进一步的长读长高通量测序。因此,第一个方面,本专利技术提供一种靶向富集高GC含量目标DNA的方法,包括以下步骤:(a)根据高GC含量目标DNA的特异性侧翼序列设计单链寡核苷酸探针,通过目标序列捕获技术从基因组中捕获目标DNA;(b)利用多重置换扩增技术对捕获到的高GC含量目标DNA进行扩增,获得扩增产物;(c)对所述扩增产物进行酶切处理以去除分支DNA中间体,获得酶切产物;(d)纯化长度不小于2kb的DNA片段,获得富集的高GC含量目标DNA。在一个实施方案中,高GC含量DNA的GC含量为80%-100%。在一个实施方案中,捕获的目标DNA的长度在2kb-30kb之间。在一个实施方案中,所述目标序列捕获技术是将单链寡核苷酸探针与基因组DNA杂交。在一个实施方案中,设计单链寡核苷酸捕获探针的方法是本领域技术人员已知的,例如不同的公司如IDT、Nimblegen、Agilent、Illumina等根据各自产品的特点进行设计。不同公司的探针虽在修饰、长度或位置分布等方面可能有所不同,但都是基于与目标序列的碱基互补配对的设计原理进行的。鉴于高GC区在基因组中有较高的冗余性,因此为了更特异地捕获目标区,本专利技术特意针对高GC区目标DNA的特异性侧翼序列(而不是针对目标序列)进行捕获探针的设计及合成。如本文所用,“侧翼序列”是指高GC含量目标DNA两侧的核苷酸序列,其与目标DNA的距离使得杂交后能够成功捕获目标DNA。“特异性侧翼序列”是指该侧翼序列相对于高GC含量的目标DNA而言具有特异性,这种特异性使得针对其设计的单链寡核苷酸捕获探针能够与该侧翼序列结合,而不与其他核苷酸序列结合,从而捕获侧翼序列之间的目标DNA。在一个实施方案中,捕获探针带有修饰的标记,例如生物素标记、荧光标记等,优选生物素标记。本领域技术人员已知捕获探针与目标区域DNA杂交的方法,其中杂交条件例如杂交温度、杂交时间以及各试剂的浓度可以通过常规技术进行确定和调整。在一个实施方案中,多重置换扩增使用的DNA聚合酶为具有链置换活性的等温扩增酶,优选为phi29。在一个实施方案中,多重链置换扩增中使用的引物为3'硫代磷酸酯键修饰的引物。在一个优选的实施方案中,所述引物的长度为6-10个核苷酸,优选6-7个核苷酸。例如,引物可以是5’-NpNpNpNpNpSNpSN-3',其中N本文档来自技高网
...

【技术保护点】
1.一种靶向富集高GC含量目标DNA的方法,包括以下步骤:(a)针对高GC含量目标DNA的特异性侧翼序列设计单链寡核苷酸探针,通过目标序列捕获技术从基因组DNA中捕获目标DNA;(b)通过多重置换扩增技术对捕获到的目标DNA进行扩增,获得扩增产物;(c)对所述扩增产物进行酶切处理以去除分支DNA中间体,获得酶切产物;(d)纯化所述酶切产物中长度不小于2kb的DNA片段,获得富集的高GC含量目标DNA。

【技术特征摘要】
1.一种靶向富集高GC含量目标DNA的方法,包括以下步骤:(a)针对高GC含量目标DNA的特异性侧翼序列设计单链寡核苷酸探针,通过目标序列捕获技术从基因组DNA中捕获目标DNA;(b)通过多重置换扩增技术对捕获到的目标DNA进行扩增,获得扩增产物;(c)对所述扩增产物进行酶切处理以去除分支DNA中间体,获得酶切产物;(d)纯化所述酶切产物中长度不小于2kb的DNA片段,获得富集的高GC含量目标DNA。2.根据权利要求1所述方法,其特征在于,高GC含量目标DNA的GC含量为80%-100%。3.根据权利要求1所述方法,其特征在于,所述目标序列捕获技术是将所述单链寡核苷酸探针与基因组DNA进行杂交。4.根据权利要求1所述的方法,其特征在于,富集的高GC含量目标DNA长度在2kb-30kb之间。5.根据权利要求1所述的方法,其特征在于,所述单链寡核苷酸探针带有生物素标记。6.根据权利要求1所述的方法,其特征在于,所述多重置换扩增技术使用的聚合酶为具有链置换活性的等温扩增酶,优选phi29DNA聚合酶。7.根据权利要求1所述的方法,其特征在于,所述多重置换扩增技术使用的引物为3'端含硫代磷酸酯键修饰的引物。8.根据权利要求1所述的方法,其特征在于,使用核酸酶,优选为T7核酸内切酶I进...

【专利技术属性】
技术研发人员:屈紫薇于涛王方明张楠楠张建光
申请(专利权)人:北京贝瑞和康生物技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1