跟踪核酸靶标来源以用于核酸测序的方法和试剂盒技术

技术编号:20083348 阅读:43 留言:0更新日期:2019-01-15 03:28
本公开提供了用于当核酸靶标断裂成更小片段时通过所述靶标的条形码标记来跟踪所述靶标来源的方法和试剂盒。通过克隆定位的核酸条形码模板在固体载体上体外捕获核酸靶标。可以以大规模并行方式同时处理数百万个核酸靶标而无需另外的分区。将这些捕获的靶标断裂成小片段,并且在每个片段上标记靶标特异性条形码序列作为它们的原始靶标的标识。这些核酸靶标跟踪方法可以用于全基因组测序和靶向测序这两者中的多种应用。

Methods and kits for tracking the source of nucleic acid targets for nucleic acid sequencing

The present disclosure provides a method and a kit for tracking the source of a nucleic acid target by barcode markers of the target when it breaks into smaller fragments. Nucleic acid target was captured on solid carrier in vitro by cloning and positioning of nucleic acid bar code template. Millions of nucleic acid targets can be processed simultaneously in a large-scale parallel manner without requiring additional partitioning. The captured targets are broken into small fragments, and the target-specific barcode sequence is labeled on each fragment as the identification of their original targets. These nucleic acid target tracking methods can be used in many applications of genome-wide sequencing and targeted sequencing.

【技术实现步骤摘要】
【国外来华专利技术】跟踪核酸靶标来源以用于核酸测序的方法和试剂盒
本公开大体上涉及用于改进的核酸测序的方法和试剂盒。
技术介绍
本专利技术属于基因组学的
更具体来说,本专利技术属于核酸测序的
核酸测序可以为多种多样的生物医学应用提供信息,所述生物医学应用包括诊断学、预后学、药物基因组学、以及法医生物学。测序可以利用基本低通量方法,包括马克萨姆-吉尔伯特测序(Maxam-Gilbertsequencing)(化学修饰的核苷酸)和桑格测序(Sangersequencing)(链终止)方法;或高通量下一代方法,包括大规模并行焦磷酸测序、边合成边测序、边连接边测序、半导体测序等。对于大部分的测序方法,在引入测序仪器中之前,需要处理样品,如核酸靶标。举例来说,可以将样品片段化、扩增或与标识物附连。独特的标识物常常用于标识特定样品的来源。大部分的测序方法产生相对短的测序读段(read),长度从数十个碱基到数百个碱基不等,并且由于有限的测序读段长度而不能产生完整的单倍型相信息。
技术实现思路
本专利技术提供了用于当核酸靶标被断裂成更小段时通过条形码标记跟踪核酸靶标来源的方法和试剂盒。可以在固体载体(例如珠粒、微粒、载片、平板或流动池)上克隆扩增或克隆合成用作条形码的多个核酸序列。本专利技术中的条形码序列的设计允许产生数十亿个不同的条形码并且每个条形码序列含有用于提高测序准确度的特征。通过这些克隆定位的核酸条形码模板在固体载体上体外捕获具有或不具有修饰的核酸靶标。使用转座酶和可转座的DNA来促进核酸靶标的片段化和条形码标记。可以以大规模并行方式同时处理数百个、数千个或数百万个核酸靶标。所述靶标中的每个可以在开放的本体(bulk)反应中被一组独特的条形码局部捕获而无需另外的分区,如用孔、微孔、洞、管、斑点、纳米通道、液滴、乳液液滴、胶囊、或用于分隔样品的部分的任何其他合适的容器进行分区。可以将这些捕获的靶标断裂成更小的片段,并且靶标特异性条形码序列将被标记到每个片段上作为其原始靶标的标识。这些核酸靶标跟踪方法可以用于全基因组测序和靶向测序这两者中的多种应用。本文提供的方法和试剂盒相对于现有方法,如Illumina公司的合成长读段和10xGenomics公司的连接读段,提供了若干优点。举例来说,本专利技术提供了数百万个至数十亿个或更多个条形码,这些条形码显著提高标记容量和特异性。条形码设计提供了减少来自长段相同类型的核苷酸,即均聚物序列的测序错误并且滤出低质量读段的特征,以使它提高测序质量。可以使用已知的化学方法(例如乳液PCR方法、桥式PCR)在固体表面上直接克隆合成或克隆或半克隆扩增条形码。基于转座酶的片段化方法简化了样品制备程序。不同于所有的现有方法,本专利技术中的条形码标记反应可以在开放的本体溶液中进行,而无需用孔、微孔、洞、管、斑点、纳米通道、液滴、乳液液滴、胶囊进行另外的分区。所述程序容易自动化或按比例放大以用于高通量样品制备。本专利技术提供了条形码标记方法,所述方法不仅用于长核酸样品以用于诸如单倍型定相、结构变异检测以及拷贝数研究的应用,而且还用于短核酸样品以跟踪样品的独特性。附图说明图1是示出了条形码序列结构和组成的实例的表。图2说明了核酸条形码模板。图3示出了两种不同的可转座的DNA设计,(A)具有一体的3'突出端的转座子互补链,(B)具有分开的互补接头寡核苷酸的转座子互补链。图4说明了通过杂交(A)和连接(B)在固体载体上捕获具有互补的3'突出端的转座子或转座体。图5说明了通过杂交(A)和连接(B)在固体载体上捕获具有互补接头寡核苷酸设计的转座子或转座体。图6是示出了核酸靶标(601)由转座体(602)标记,形成连续的转座体-核酸复合物(603),由克隆条形码模板(605)捕获在固体载体(604)上,然后片段化成条形码标记的片段(606)的示意图。图7是示出了以下的示意图:多个核酸靶标(701)由转座体(702)同时标记,由克隆条形码模板(705)分别捕获在连续固体表面(704,例如流动池表面)上分开的斑点处或单独的固体载体(例如珠粒或微粒,未示出)上,并且在没有另外分区的开放的本体反应中片段化成条形码标记的片段。图8是示出了通过油包水乳液液滴(805)封装转座体-核酸复合物(801)和带克隆条形码的珠粒(802)以产生条形码(803)标记的核酸片段的示意图。图9说明了在乳液液滴中产生固定的条形码标记的片段的两种不同的方式。图10是示出了液滴(1003)中的转座体-核酸复合物(1001)与另一个液滴(1005)中的克隆条形码(1004)池合并成组合液滴(1006)以产生条形码标记的片段(1007)的示意图。图11说明了在液滴中产生条形码标记的片段的两种不同的方式。图12说明了以不同形式固定在固体载体上的具有转座酶结合区(TBR)的条形码模板。(A)在一端具有TBR的条形码模板;(B)固体载体上呈双链形式的在游离端具有TBR的固定的条形码模板;(C)固体载体上呈单链形式的在游离端具有TBR的固定的条形码模板,TBR的互补链可以通过引物退火、杂交、和/或引物延伸来引入。图13是示出了使转座酶(1303)与固体载体(1302)上具有TBR末端的条形码模板(1301)结合,之后捕获并片段化核酸靶标(1305)以用于条形码标记的示意图。图14是示出了以下的示意图:使转座酶(1403)结合到在固体载体(1402)上的不同分离位置处的具有TBR末端的克隆条形码模板(1401)上,每个位置并行捕获不同的核酸靶标,并且在没有另外分区的开放的本体反应中将它在固体载体上用条形码标签片段化。图15提供了通过引物延伸(A)和/或PCR扩增(B)释放固定的条形码标记片段的一个或多个拷贝(C)的图示。图16是Illumina公司的由条形码标记片段产生的测序文库和其测序方法的实例。图17是IonTorrent公司的由条形码标记片段产生的测序文库和其测序方法的实例。图18是使用释放的条形码标记的片段进行靶向扩增的图示。图19是直接从固体载体上条形码标记的片段富集所关注的基因的图示。图20示出了条形码以及条形码模板序列和结构的具体实例。图21示出了通过测序检测的特异性设计的条形码的每个位置处的核苷酸含量。图22列出了具有用于被条形码模板捕获的可附连的末端的MuA可转座的DNA设计的三个实例。图23是在MuA标记反应之后片段化的基因组DNA的琼脂糖凝胶电泳照片。L:1KbplusDNA标准梯(单位:bp),S:片段化的DNA样品。图24是在TapeStation上的高灵敏度D5000screentape上运行的条形码标记的Illumina测序文库的电泳图。图25是示出了用本专利技术中所述的条形码标记法构建的Illumina测序文库结构的示意图。图26示出了相同条形码读段1到下一次比对的读段距离的读段1测序读段计数直方图。所有图中的转座酶在基于MuA转座系统的转座体中被示为四聚体。具体实施方式大部分可商购获得的测序技术具有有限的测序读段长度。第二代测序技术尤其仅可以对几百个碱基进行测序并且很少达到一千个碱基。然而,基因的核酸序列可以从数千碱基至数十和数百千碱基,这意味着数十千碱基的测序读段长度对于成功确定所有基因的单倍型是必需的。本公开提供了用于将核酸靶标处理成更小本文档来自技高网...

【技术保护点】
1.一种通过条形码标记来跟踪核酸靶标来源的方法,所述方法包括:a.提供上面固定有克隆条形码模板或半克隆条形码模板的固体载体,其中每个条形码模板包含中心条形码和至少一个侧接柄部序列;b.提供多个核酸靶标;c.使所述核酸靶标与所述固体载体附连;以及d.将所述核酸靶标断裂成片段,其中每个片段与所述固体载体上的条形码模板附连。

【技术特征摘要】
【国外来华专利技术】2016.03.01 US 62/301,9671.一种通过条形码标记来跟踪核酸靶标来源的方法,所述方法包括:a.提供上面固定有克隆条形码模板或半克隆条形码模板的固体载体,其中每个条形码模板包含中心条形码和至少一个侧接柄部序列;b.提供多个核酸靶标;c.使所述核酸靶标与所述固体载体附连;以及d.将所述核酸靶标断裂成片段,其中每个片段与所述固体载体上的条形码模板附连。2.权利要求1的方法,其中使所述核酸靶标与所述固体载体附连在不将总的多个核酸靶标内每个核酸靶标与另一个核酸靶标分区的情况下发生。3.权利要求1的方法,其中所述固体载体选自珠粒、微粒、载片、平板、流动池以及其组合,并且其中当所述固体载体是物理上可分离的,如珠粒或微粒时,所述条形码模板被克隆或半克隆地固定到整个表面上,并且当所述固体载体是连续平坦表面,如载片、平板或流动池时,所述条形码模板作为可分离的克隆簇或半克隆簇被固定到所述表面上。4.权利要求1的方法,所述方法还包括提供转座酶。5.权利要求4的方法,其中所述转座酶选自野生型Tn转座酶、野生型Mu转座酶、野生型Ty转座酶和野生型Tc转座酶或它们的突变型或标记型以及其组合。6.权利要求5的方法,其中所述转座酶是MuA转座酶或Tn5转座酶或其组合。7.权利要求1的方法,所述方法还包括提供可转座的DNA,其中在与带条形码的固体载体附连之前,将所述核酸靶标与转座酶和所述可转座的DNA混合以形成核酸-转座体复合物。8.权利要求7的方法,其中所述可转座的DNA含有转座子DNA部分,其中所述转座子DNA选自野生型Tn转座子DNA、野生型Mu转座子DNA、野生型Ty转座子DNA和野生型Tc转座子DNA或它们的突变型以及其组合。9.权利要求8的方法,其中所述转座子DNA是Tn5转座子DNA或MuA转座子DNA或其组合。10.权利要求7的方法,其中所述可转座的DNA可与固定的条形码模板附连并且包含:a.可与所述条形码模板的3'末端连接的5'末端转座子连接链;以及b.所述转座子互补链的与所述条形码模板的3'末端重叠的3'末端突出端;或c.在一端与所述条形码模板的3'末端重叠并且在另一端与所述转座子连接链的5'末端重叠的接头寡核苷酸。11.权利要求1的方法,其中使核酸靶标与所述条形码模板附连包括连接、杂交、交联、转座、引物延伸或扩增,其中所述转座包括转座酶催化反应,其中所述条形码模板含有转座酶结合区。12.权利要求1的方法,其中使所述靶核酸与所述固体载体附连包括实现约1000:1至约0.01:1的所述核酸靶标与所述条形码模板的比率。13.权利要求12的方法,其中所述比率是约100:1至约0.1:1。14.权利要求13的方法,其中所述比率是约10:1至约1:1。15.权利要求1的方法,其中所述断裂包括通过热、蛋白酶、和/或蛋白质变性剂进行处理,而不复制所述核酸靶标的任何部分。16.权利要求1的方法,其中所述断裂包括用引物延伸反应、链置换反应或扩增反应复制所述核酸靶标的一部分。17.权利要求1的方法,所述方法还包括通过化学切割或者经由引物延伸或PCR扩增进行拷贝来从所述固体载体释放条形码标记的核酸片段。18.一种用条形码标记的核酸片段产生核酸文库的方法,所述方法包括按照权利要求1的方法标记核酸靶标。19.权利要求1的方法,所述方法在产生条形码标记的片段之后还包括:a.用针对靶基因、基因或外显子组的第一组引物进行引物延伸反应,以及b.用含有所述条形码模板序列的一部分的通用引物和针对靶基因、基因或外显子组的第二组引物进行扩增反应;其中所述第二组引物被嵌套在所述第一组引物的产物中。20.权利要求1的方法,所述方法在产生条形码标记的片段之后还包括:a.用含有所述条形码模板序列的一部分的通用引物和针对靶基因、基因或外显子组的第一组引物进行扩增;以及b.用含有所述条形码模板序列的一部分的通用引物和针对靶基因、基因或外显子组的第二组引物进行扩增;其中所述第二组引物被嵌套在所述第一组引物的产物中。21.一种通过条形码标记来跟踪核酸靶标来源的方法,所述方法包括:a.提供各自含有克隆或半克隆条形码模板的多个容器,其中每个条形码模板包含中心条形码和至少一个侧接柄部序列;b.提供多个天然或修饰的核酸靶标;c.将所述条形码容器和所述核酸靶标合并成多个分区,以使得大部分的分区各自含有单个容器和至少一个所述核酸靶标,并且所述核酸靶标与所述分区内的多个克隆条形码模板附连;以及d.将所述核酸靶标断裂成片段,其中每个片段与由所述容器提供的条形码附连而不复制所述核酸靶标的任何部分。22.权利要求21的方法,其中所述容器是珠粒、微粒、乳液液滴、或其组合。23.权利要求21的方法,其中所述分区是液滴或乳液液滴。24.权利要求21的方法,所述方法还包括提供转座酶。25.权利要求24的方法,其中所述转座酶选自野生型Tn转座酶、野生型Mu转座酶、野生型Ty转座酶和野生型Tc转座酶或它们的突变型或标记型以及其组合。26.权利要求25的方法,其中所述转座酶是MuA转座酶或Tn5转座酶或其组合。27.权利要求21的方法,所述方法还包括提供可转座的DNA,其中在与所述条形码模板容器合并之前,将所述核酸靶标与所述转座酶和可转座的DNA混合以形成DNA-转座体复合物。28.权利要求27的方法,其中所述可转座的DNA含有转座子DNA部分,其中所述转座子DNA选自野生型Tn转座子DNA、野生型Mu转座子DNA、野生型Ty转座子DNA和野生型Tc转座子DNA或它们的突变型以及其组合。29.权利要求28的方法,其中所述转座子DNA是Tn5转座子DNA或MuA转座子DNA或其组合。30.权利要求27的方法,其中所述可转座的DNA可与固定的条形码模板附连并且包含:a.可与所述条形码模板的3'末端连接的5'末端转座子连接链;以及b.所述转座子互补链的与所述条形码模板的3'末端重叠的3'末端突出端;或c.在一端与所述条形码模板的3'末端重叠并且在另一端与所述转座子连接链的5'末端重叠的接头寡核苷酸。31.权利要求21的方法,其中所述条形码模板是以双链形式或部分双链形式供应的,以使得所述条形码模板的末端含有双链转座酶结合区,在所述双链转座酶结合区处转座酶能够结合并且进行转座反应。32.权利要求21的方法,其中所述条形码模板是以单链形式供应的,其中通过引物退火或引物延伸反应将所述单链条形码模板转化成双链或部分双链条形码模板以使得所述条形码模板的末端含有双链转座酶结合区,在所述双链转座酶结合区处转座酶能够结合并且进行转座反应。33.权利要求21的方法,其中所述附连包括所述靶核酸与所述条形码模板的连接、直接或间接杂交、转座,其中所述转座包括转座酶催化反应,其中所述条形码模板含有转座酶结合区。34.权利要求21的方法,其中所述断裂包括通过热、蛋白酶或其他蛋白质变性剂进行处理,而不...

【专利技术属性】
技术研发人员:陈宙涛范龙金谷俊臣雷明
申请(专利权)人:通用测序技术公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1