一种从预文库中富集靶标序列的方法和应用技术

技术编号:20931830 阅读:25 留言:0更新日期:2019-04-20 13:27
本申请公开了一种从预文库中富集靶标序列的方法和应用。本申请的方法包括,采用蛋白核酸复合物对预文库中的靶标序列进行识别和酶切;利用DNA连接酶将捕获接头连接到靶标序列切割末端;利用捕获接头上的修饰或捕获接头与靶标序列连接时的polyA尾的修饰将靶标序列分离富集;蛋白核酸复合物由Cas酶和RNA引导序列组装成,RNA引导序列能特异性的结合靶标序列,Cas酶用于切割。本申请的方法,利用蛋白核酸复合物的精准识别功能,识别和分离靶标序列,采用不同的RNA引导序列,可富集多个靶标区域,且没有多重PCR富集方法的偏好性,可以检测点突变、小插入和缺失、基因融合等多种变异类型,使用简单、成本低廉、准确度高。

A Method for Enriching Target Sequences from Pre-Library and Its Application

This application discloses a method and application for enriching target sequences from a pre-library. The methods of this application include: identifying and digesting target sequences in the prelibrary by protein nucleic acid complexes; connecting the capture junction to the cutting end of the target sequence by DNA ligase; separating and enriching the target sequence by modifying the capture junction or modifying the polyA tail when the capture junction is connected to the target sequence; and guiding the sequence group by Casase and RNA. As a result, RNA-guided sequences can specifically bind to target sequences, and Caspase is used for cleavage. The proposed method uses the precise recognition function of protein nucleic acid complexes to identify and separate target sequences. Different RNA-guided sequences can enrich multiple target regions without the preference of multiple PCR enrichment methods. It can detect point mutation, small insertion and deletion, gene fusion and other mutation types. It is simple to use, low cost and high accuracy.

【技术实现步骤摘要】
一种从预文库中富集靶标序列的方法和应用
本申请涉及DNA富集领域,特别是涉及一种从预文库中富集靶标序列的方法和应用。
技术介绍
当前科技的高速发展使DNA测序在医学、农业、环境、工业等各个领域得到广泛应用。新一代测序技术(NGS)的高速发展使全基因组测序成本不断降低。但是目标区域富集测序由于其检测成本更低,目标基因检测质量高,准确度好,仍然是新一代测序技术在各种测序应用中最常见的方法手段。目前比较常见的目标区域富集测序方法主要分三类:多重PCR富集方法、基于探针杂交的捕获方法、反向分子探针杂交方法。多重PCR富集方法是应用非常广泛的一种方法,该方法应用多对引物同时对多个目标区域进行扩增,并最终构建成NGS文库进行测序;该方法引物设计较简单,成本低廉,便于操作。但是,该方法的缺点是随着目标区域增多,引物之间的相互干扰越来越大,会产生大量的非特异性扩增,甚至会出现没有目标区域扩增的情况。另外,由于不同的扩增子其碱基序列GC含量等差异,在一个扩增体系中会出现严重的扩增偏好性,进而造成浪费测序数据的现象。基于探针杂交捕获的方法是将捕获探针固定在捕获芯片上,或者游离在液体试剂中,探针长度一般为60ng-120nt之间,捕获区域可以长达几个Mb;该方法操作比较复杂,操作时间长,灵敏度低,往往需要比较大量的样本才能进行杂交捕获。分子反向探针杂交法是近几年出现的一种新方法。分子反向探针在两端含有待捕获区域的两端同源序列,可以杂交到相关区域上形成环状。经过酶延伸并且连接后即形成一个分子环。待消化掉未形成环的非目标分子后再通过反向PCR扩增的方法将目标区域分子扩增下来形成文库。该方法特异性高,操作较简便。但是反向探针设计很复杂,做多个区域捕获时成本高昂。因此,为了满足日益广泛的基因测序需求,研发一种更有效的目标DNA富集试剂或方法,是本领域的研究重点。
技术实现思路
本申请的目的是提供一种新的从预文库中富集靶标序列的方法和应用。为了实现上述目的,本申请采用了以下技术方案:本申请的一方面公开了一种从预文库中富集靶标序列的方法,包括采用蛋白核酸复合物对预文库中的靶标序列进行特异性识别和酶切;然后利用DNA连接酶将捕获接头连接到靶标序列的切割末端;利用捕获接头上的修饰或者捕获接头与靶标序列切割末端连接时的polyA尾的修饰将靶标序列分离、富集;蛋白核酸复合物由Cas酶和RNA引导序列组装而成,RNA引导序列能够特异性的与靶标序列结合,Cas酶能够特异性的识别与RNA引导序列结合的靶标序列,并将靶标序列切割;捕获接头包含高通量测序平台的接头序列。其中,预文库是指DNA样品经过打断处理、末端修复、加polyA尾、加接头的双链DNA文库,进一步的,在加接头后还经过PCR扩增获得的双链DNA文库。该双链DNA文库中包含有本申请的靶标序列,以及其它更多的非靶标序列;而本申请的试剂盒就是要从众多的非靶标序列中,将靶标序列分离、富集;因此,将该双链DNA文库称为预文库。本申请中捕获接头是指在经过Cas酶酶切后加入的一段DNA序列,实际上,捕获接头也是适应于测序平台的接头序列,与预文库中“加接头”的接头序列属于同一类型的DNA序列,只是为了区别于预文库原本的接头序列,本申请在Cas酶酶切后加入的接头成为捕获接头。实际上,捕获接头与预文库中的接头相比,一方面,可以是索引序列不同,以示区分即可,进一步的,也可以设计不同的通用引物序列结合区;另一方面,本申请的捕获接头还可以进行修饰,例如生物素标记等。需要说明的是,本申请的方法,其关键在于利用CRISPR-Cas系统对靶标序列的特异性识别和切割作用,将捕获接头连接到靶标序列上,利用捕获接头带的修饰,或者捕获接头与靶标序列连接时的polyA尾上的修饰,对靶标序列进行分离、富集。其中,修饰基团可以是常规采用的,例如生物素标记,也可以是其它能够识别并能够被分离的修饰基团,在此不作具体限定。还需要说明的是,本申请最终将靶标序列分离出来,是通过捕获接头或polyA尾的修饰实现的,例如生物素标记;在实际应用中,在酶切后,会产生平末端,在该平末端上加捕获接头时,通常需要先加polyA尾,然后再连接接头;所以,这里就存在两个操作空间:第一,在加polyA尾时,使用具有修饰的dATP,例如生物素标记的dATP,形成具有生物素标记等修饰的polyA尾,用于后续的分离和富集;第二,使用本身具有修饰的捕获接头,例如生物素标记的捕获接头,然后再进行分离和富集。优选的,本申请的靶标序列富集方法中,修饰为生物素标记,将靶标序列分离,具体包括,利用亲和素修饰的磁珠,将带有生物素标记的靶标序列分离出来。需要说明的是,一方面,生物素标记是本领域常规使用的标记方法,不排除还可以采用其它的修饰基团;另一方面,亲和素修饰的磁珠是生物素标记DNA常规使用的分离、纯化方式,除磁珠以外,也可以采用其它的过滤膜、过滤柱等方式对生物素标记进行分离、富集,在此不作具体限定。优选的,本申请的靶标序列富集方法还包括采用针对捕获接头设计的通用引物和针对预文库的接头设计的通用引物,对分离的靶标序列进行PCR扩增,进一步富集靶标序列。需要说明的是,捕获接头与预文库的接头实际上,只要是索引序列不同即可,因此,针对捕获接头设计的通用引物和预文库的通用引物也可以是相同的;当然,本申请的一种实现方式中,具体将两者设计为不同的引物序列,以免混淆;并且,设计为不同的引物序列也可以避免非靶标序列残留也被扩增。还需要说明的是,对于本申请的靶标序列富集方法中,在Cas酶酶切后,是将靶标序列一分为二的,两段靶标的末端再分别连接捕获接头,由此形成的靶标序列,也就是说,靶标序列的一端是酶切后加入的捕获接头,另一端仍然是预文库时加入的接头;所以,在完成分离、富集后,为了进一步的对靶标序列进行富集,本申请优选的还采用PCR扩增构建最终的测序文库,其采用的引物就是针对捕获接头设计的通用引物和针对预文库接头设计的通用引物,即针对靶标序列两端不同的接头设计通用引物进行PCR扩增。优选的,本申请的靶标序列富集方法中,蛋白核酸复合物的制备方法包括,根据需要富集的靶标序列,采用CRISPR-Cas系统设计特异性扩增引物,并采用设计的特异性扩增引物扩增获得含有CRISPR-Cas引导序列和靶标区域序列的双链DNA;然后使用T7或U6转录酶将双链DNA转录成RNA,做为靶标区域的RNA引导序列;将Cas酶与RNA引导序列组装,即获得蛋白核酸复合物。本申请的另一面公开了本申请的靶标序列富集方法在目标DNA的测序或文库构建中的应用。本申请的再一面公开了一种目标DNA的文库构建方法,包括采用本申请的靶标序列富集方法对目标DNA进行富集,然后再进行后续的文库构建步骤。本申请的再一面公开了一种目标DNA的测序方法,包括采用本申请的文库构建方法制备测序文库,然后对制备的测序文库进行测序。可以理解,本申请的靶标序列富集方法,其核心的试剂,例如蛋白核酸复合物、DNA连接酶和捕获接头等,完全可以单独作为一种用于从预文库中富集靶标序列的试剂盒使用。因此,在提出本申请的靶标序列富集方法的同时,本申请还提供了一种用于从预文库中富集靶标序列的试剂盒,包括蛋白核酸复合物、DNA连接酶和捕获接头;蛋白核酸复合物由Cas酶和R本文档来自技高网
...

【技术保护点】
1.一种从预文库中富集靶标序列的方法,其特征在于:包括采用蛋白核酸复合物对预文库中的靶标序列进行特异性识别和酶切;然后利用DNA连接酶将捕获接头连接到靶标序列的切割末端;利用捕获接头上的修饰或者捕获接头与靶标序列切割末端连接时的polyA尾的修饰将靶标序列分离、富集;所述蛋白核酸复合物由Cas酶和RNA引导序列组装而成,所述RNA引导序列能够特异性的与靶标序列结合,所述Cas酶能够特异性的识别与RNA引导序列结合的靶标序列,并将靶标序列切割;所述捕获接头包含高通量测序平台的接头序列。

【技术特征摘要】
1.一种从预文库中富集靶标序列的方法,其特征在于:包括采用蛋白核酸复合物对预文库中的靶标序列进行特异性识别和酶切;然后利用DNA连接酶将捕获接头连接到靶标序列的切割末端;利用捕获接头上的修饰或者捕获接头与靶标序列切割末端连接时的polyA尾的修饰将靶标序列分离、富集;所述蛋白核酸复合物由Cas酶和RNA引导序列组装而成,所述RNA引导序列能够特异性的与靶标序列结合,所述Cas酶能够特异性的识别与RNA引导序列结合的靶标序列,并将靶标序列切割;所述捕获接头包含高通量测序平台的接头序列。2.根据权利要求1所述的方法,其特征在于:所述修饰为生物素标记,所述将靶标序列分离,具体包括,利用亲和素修饰的磁珠,将带有生物素标记的靶标序列分离出来。3.根据权利要求1或2所述的方法,其特征在于:还包括采用针对捕获接头设计的通用引物和针对预文库的接头设计的通用引物,对分离...

【专利技术属性】
技术研发人员:王永利宋卓
申请(专利权)人:人和未来生物科技长沙有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1