利用相位移区块合成条码化序列及其用途制造技术

技术编号:18843302 阅读:39 留言:0更新日期:2018-09-05 08:51
本文提供了用于生成相位移条码寡核苷酸的组合物和方法,用于下一代测序的文库构建。在一些情况中,条码寡核苷酸与颗粒或珠连接。具体而言,提供了条码寡核苷酸文库,各条码寡核苷酸包括可变区域(例如,条码区域)、通用区域(例如,限定区域)和相位移区域,其中,第一条码寡核苷酸的限定区域的第一核苷酸与第二条码寡核苷酸的限定区域的第一核苷酸错开1‑50个核苷酸。还提供了使用条码寡核苷酸文库进行测序的方法和试剂盒。

Synthesis of barcode sequences using phase-shifting blocks and their uses

Compositions and methods for generating phase-shifted barcode oligonucleotides are provided for the construction of next-generation sequencing libraries. In some cases, barcode oligonucleotides are linked to particles or beads. Specifically, a barcode oligonucleotide library is provided, each barcode oligonucleotide comprising a variable region (e.g., a barcode region), a universal region (e.g., a restricted region) and a phase shift region, wherein the first nucleotide of the first barcode oligonucleotide limited region and the first nucleotide of the second barcode oligonucleotide limited region are provided. Stagger 1 to 50 nucleotides. Methods and kits for sequencing using barcode oligonucleotide libraries are also provided.

【技术实现步骤摘要】
【国外来华专利技术】利用相位移区块合成条码化序列及其用途相关申请的交叉引用本申请要求2016年1月12日提交的美国临时申请第62/277,783号的优先权,其通过引用全文纳入本文。
技术介绍
下一代测序可以用于平行评估数百万个的DNA链的序列。例如,在亿明达公司(Illumina)的测序技术中,DNA的多个克隆簇在表面上形成,并且藉由合成的测序通过将簇DNA用作底物进行。在各测序循环中,在各条DNA链上平行评估一个新的碱基。因此,重要的是在合成步骤中明确地鉴定簇。如果流动池上的全部簇在相同的位置包含相同的碱基,那么软件不能够正确地区分碱基,并且测序质量可能会下降,或者测序运行可能会失败。当待测序的大部分DNA链的在相同位置具有相同碱基时,大部分的测序平台会遇到这样的技术问题。对于一些应用,需要在测序前标记、标签化或条码化某些DNA分子。这意味着待测序的分子可以包含至少两个区域:(1)条码,和(2)捕获核苷酸。这通常需要具有大量不同的条码以及这些条码相同的拷贝。需要标记这样的DNA分子,其旨在与相同的条码组合在一起。相同的条码可以包括在不同的孔或管中,或者在其他情况中,它们可以与多个珠物理附连(link)。创造条码和捕获核苷酸有许多不同的方法。例如,引物延伸可以用于合成。采用该方法,条码核苷酸可以具有至少两个区域:(1)用作条码的核苷酸,和(2)用作引发、杂交或连接位点的核苷酸。如此,使用构建区块(buildingblock),通过例如利用恒定,通用引发位点的连接、杂交或PCR将区块接合在一起,可以合成整个条码化区域。这些恒定,通用引发位点可能引起测序问题。例如,大部分的序列沿着DNA链的相同位置可以具有相同或几乎相同的核苷酸图案(序列)。在一些情况中,序列在各位置可能具有低多样性。对于该问题的解决方案包括在测序运行中使用随机、非相关的序列,诸如Phix对照(亿明达)以提高跨簇的多样性。这将在各测序循环期间产生足够的变异,但是稀释了准确的样品并且降低了测序能力。
技术实现思路
在一方面,本文提供了条码寡核苷酸文库,各条码寡核苷酸包括可变区域(例如,条码区域)、通用(universalregion)区域(例如,限定区域)和相位移(phase-shift)区域,其中,第一条码寡核苷酸限定区域的第一核苷酸与第二条码寡核苷酸限定区域的第一核苷酸错开(stagger)1-50个核苷酸。条码寡核苷酸可以游离于溶液中或者附着于珠。条码核苷酸可以处于诸如孔、管或平板的分区(partition)中。在一些实施方式中,一个或多个条码寡核苷酸处于分区中。在一些情况中,不同的条码寡核苷酸存在于不同的分区,例如,不同的孔或不同的管。在一些实施方式中,各条码寡核苷酸处于分开的分区中。在其它一些实施方式中,各条码寡核苷酸与珠连接。珠可以是水凝胶珠、塑料珠、玻璃珠或金属珠。在一些实施方式中,相位移区域是在通用区域之前(例如,5′方向)。在一些实施方式中,多个条码寡核苷酸各自的相位移区域基本独特,并且具有1-50个核苷酸的长度。在一些情况中,通用区域在其3′末端与核苷酸序列附连。多个条码寡核苷酸各自的可变区域可以基本独特,并且具有至少3个核苷酸的长度。在一些情况中,各条码寡核苷酸包括超过一个可变区域。多个条码寡核苷酸各自的通用区域可以基本相同,并且具有至少6个核苷酸的长度。在其它情况中,各条码寡核苷酸包括超过一个通用区域。文库的各条码寡核苷酸可以还包括捕获区域。在一些情况中,捕获区域包括聚胸苷序列、聚腺苷序列或随机序列。在另一方面,本文提供了条码珠(例如,颗粒)的文库,其包括多个与多个条码寡核苷酸偶联的珠,其中各珠与不同的条码寡核苷酸偶联。各条码寡核苷酸包括:可变区域(例如,条码区域)、通用区域(例如,限定区域)和相位移区域,其中,第一条码寡核苷酸通用区域的第一核苷酸与第二条码寡核苷酸通用区域的第一核苷酸错开1-50个核苷酸,并且其中各珠与至少两个相同的条码寡核苷酸偶联。各条码寡核苷酸还可以还包括捕获区域(捕获序列)。在一些实施方式中,相位移区域位于通用区域之前。在一些实例中,通用区域之内和之后存在至少两个不同的核苷酸,其位于多个条码寡核苷酸中的条码寡核苷酸的任意位置。在一些实施方式中,通用区域在多个条码寡核苷酸中是相同的。多个条码寡核苷酸各自的相位移区域可以基本独特,并且具有1-50个核苷酸的长度。多个条码寡核苷酸各自的可变区域可以基本独特,并且具有至少3个核苷酸的长度。多个条码寡核苷酸的通用区域可以相同,并且具有至少6个核苷酸的长度。在一些实施方式中,各条码寡核苷酸包括超过一个可变区域。各条码寡核苷酸可以包括超过一个通用区域。一些实例中,各条码寡核苷酸还包括独特的分子标识物。独特的分子标识物可以包括3-100个核苷酸。一些实施方式中,各条码寡核苷酸还包括捕获区域。在一些实施方式中,各珠与至少两个不同的条码寡核苷酸偶联。珠可以是水凝胶珠,塑料珠,如聚苯乙烯珠或PMMA珠,玻璃珠或金属珠。在另一方面,本文提供了这样的试剂盒,其包括任意一个本文所公开的条码寡核苷酸的文库或任意一个本文所公开的条码寡核苷酸珠的文库,以及用于将文库划分成多个分区的试剂。用于划分的试剂可以包括与水不互溶的液体。在另一方面中,本文提供了用于分析细胞群核酸的方法。该方法包括:提供任意一个本文所公开的条码寡核苷酸的文库或任意一个本文所公开的条码寡核苷酸珠的文库;提供细胞群;对条码寡核苷酸文库或条码寡核苷酸珠文库以及细胞群进行划分以生成多个分区(例如,孔、管、平板或液滴),其具有来自单个细胞的单个条码寡核苷酸和核酸;使细胞群裂解以生成来自单个细胞的核酸;在各分区中将条码寡核苷酸与来自单个细胞的核酸杂交;在各分区中进行模板引导的核酸聚合以将寡核苷酸引物共价地连接到单个细胞的核酸;并且进行高通量测序。在一些实施方式中,单个细胞的核酸是RNA或cDNA。在一些实施方式中,模板引导的核酸聚合包括逆转录。模板引导的核酸聚合可以包括DNA扩增。在另一方面,本文提供了一种合成任意一个本文所公开的条码寡核苷酸的文库的方法。所述方法包括:(a)将引物退火至核苷酸序列,其中,所述引物包括与所述核苷酸的部分互补的序列,可变区域,通用区域和相位移区域;(b)延伸退火的引物以形成珠,所述珠连接至包括所述可变区域,可变区域和相位移区域的条码寡核苷酸;(c)置换所述退火的第一引物;并且重复步骤(a)至(c)以生成条码寡核苷酸的文库。在一些实施方式中,该方法还包括进行引物延伸以向各条码寡核苷酸添加一个或多个可变区域和/或一个或多个通用区域。在一些实例中,该方法包括进行引物延伸以向各条码寡核苷酸添加捕获区域。在一些实施方式中,捕获区域可以包括聚胸苷序列、聚腺苷序列或随机序列。该方法还可以包括将步骤(a)的核苷酸序列连接至珠,从而生成条码寡核苷酸珠的文库。在另一方面中,提供了连接至固体支持物(例如,珠)的相位移条码寡核苷酸的文库以及相位移条码寡核苷的文库。在一些实施方式中,相位移条码寡核苷酸序列包括相位移区域,其具有1-50个核苷酸的长度,一个或多个可变区域(例如,条码区域)和一个或多个通用区域(例如,限定区域)。在一些实施方式中,文库中第一条码核苷酸通用区域(例如,限定区域)的第一核苷酸与文库中第二条码序列通用区域(例本文档来自技高网
...

【技术保护点】
1.一种条码寡核苷酸文库,各条码寡核苷酸包括可变区域、通用区域和相位移区域,其中,第一条码寡核苷酸的通用区域的第一核苷酸与第二条码寡核苷酸的通用区域的第一核苷酸错开1‑50个核苷酸。

【技术特征摘要】
【国外来华专利技术】2016.01.12 US 62/277,7831.一种条码寡核苷酸文库,各条码寡核苷酸包括可变区域、通用区域和相位移区域,其中,第一条码寡核苷酸的通用区域的第一核苷酸与第二条码寡核苷酸的通用区域的第一核苷酸错开1-50个核苷酸。2.如权利要求1所述的条码寡核苷酸文库,其中,一个或多个条码寡核苷酸处于分区中。3.如权利要求1或2所述的条码寡核苷酸文库,其中,各条码寡核苷酸与珠连接。4.如权利要求3所述的条码寡核苷酸文库,其中,所述珠是水凝胶珠、塑料珠、玻璃珠或金属珠。5.如权利要求1-4中任一项所述的条码寡核苷酸文库,其中,所述相位移区域在所述通用区域之前。6.如权利要求1-5中任一项所述的条码寡核苷酸文库,其中,所述多个条码寡核苷酸中每一个的所述相位移区域具有1-50个核苷酸的长度。7.如权利要求1-6中任一项所述的条码寡核苷酸文库,其中,所述通用区域在3′末端与核苷酸序列连接。8.如权利要求1-7中任一项所述的条码寡核苷酸文库,其中,所述多个条码寡核苷酸中每一个的所述可变区域具有至少3个核苷酸的长度。9.如权利要求1-8中任一项所述的条码寡核苷酸文库,其中,各条码寡核苷酸包括超过一个可变区域。10.如权利要求1-9中任一项所述的条码寡核苷酸文库,其中,所述多个条码寡核苷酸中每一个的所述通用区域包括相同的序列,并且,其中,所述通用区域具有至少6个核苷酸的长度。11.如权利要求1-10中任一项所述的条码寡核苷酸文库,其中,各条码寡核苷酸包括超过一个通用区域。12.如权利要求1-11中任一项所述的条码寡核苷酸文库,其中,各条码寡核苷酸还包括捕获区域。13.如权利要求12所述的条码寡核苷酸文库,其中,所述捕获区域包括聚胸苷序列、聚腺苷序列或随机序列。14.一种条码珠文库,其包括:多个珠,其中,各珠与多个条码寡核苷酸偶联,并且其中,所述文库中的各珠与独特的条码寡核苷酸偶联,各条码寡核苷酸包括可变区域、通用区域和相位移区域,其中,第一条码寡核苷酸的通用区域的第一核苷酸与第二条码寡核苷酸的通用区域的第一核苷酸错开1-50个核苷酸;并且其中,对于各珠,条码寡核苷酸的至少两个相同的拷贝与所述珠偶联。15.如权利要求14所述的文库,其中,所述相位移区域位于所述通用区域之前。16.如权利要求14或15所述的文库,其中,所述通用区域之内和之后存在至少两个不同的核苷酸,其位于所述多个条码寡核苷酸中的所述条码寡核苷酸的任意位置。17.如权利要求14-16中任一项所述的文库,其中,在所述多个条码寡核苷酸的每一个中,所述通用区域包括相同的序列。18.如权利要求14-17中任一项所述的文库,其中,所述多个条码寡核苷酸中每一个的所述相位移区域具有1-50个核苷酸的长度。19.如权利要求14-18中任一项所述的文库,其中,所述多个条码寡核苷酸中每一个的所述可变区域具有至少3个核苷酸的长度。20.如权利要求14-19中任一项所述的文库,其中,各条码寡核苷酸包括超过一个可变区域。21.如权利要求14-20中任一项所述的文库,其中,所述多个条码寡核苷酸的所述通用区域具有至少6个核苷酸的长度。22.如权利要求14-21中任一项所述的文库,其中,各条码寡核苷酸包括超过一个通用区域。23.如权利要求14-22中任一项所述的文库,其中,各条码寡核苷酸还包括独特的分子标识物。24.如权利要求23所述的文库,其中,所述独特的分子标识物具有3-100个核...

【专利技术属性】
技术研发人员:L·弗兰茨J·阿格雷丝迪
申请(专利权)人:生物辐射实验室股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1