核酸的序列特异性靶向转座和选择以及分选制造技术

技术编号:37977537 阅读:22 留言:0更新日期:2023-06-30 09:52
本文描述了可用于介导核酸的序列特异性靶向转座的多种不同类型的靶向转座体复合物。本文还描述了一种表征包含期望样品和不需要的样品两者的样品混合池中的期望样品的方法,该方法包括:从双链核酸产生测序数据,首先对包含来自混合池的多个核酸样品的文库进行测序,其中每个核酸文库包含来自单个样品的核酸和独特样品条形码以将来自该单个样品的核酸与来自该文库中其他样品的核酸区分开;分析该测序数据并鉴定与来自期望样品的测序数据相关联的独特样品条形码;对该文库进行选择步骤,包括从期望样品富集核酸样品以及/或者从不需要的样品耗尽核酸样品;以及对该核酸文库进行重新测序。进行重新测序。进行重新测序。

【技术实现步骤摘要】
【国外来华专利技术】核酸的序列特异性靶向转座和选择以及分选
[0001]相关申请的交叉引用
[0002]本申请要求2020年8月18日各自提交的美国临时申请63/066,905和63/066,906;2021年3月18日提交的US 63/162,775;2021年3月19日提交的US 63/163,381;2021年3月31日提交的US 63/168,753;以及2021年8月2日提交的US 63/228,344的优先权的权益,这些临时申请中的每一篇以引用方式全文并入本文以用于任何目的。
[0003]序列表
[0004]本申请与电子格式的序列表一起提交。序列表以创建于2021年7月28日的名称为“2021

07

28_01243

0020

00PCT_Seq_List_ST25”的文件提供,该文件大小为4,096字节。序列表的电子格式的信息以引用方式全文并入本文。
[0005]说明


[0006]本公开涉及核酸的序列特异性靶向转座。靶向转座体复合物可用于介导序列特异性靶向转座。本公开涉及包括用于评估期望样品的初始测序、选择和重新测序的方法。如本文所述,初始测序可鉴定混合样品池中的感兴趣的样品,并且然后可耗尽不需要的样品,或可基于独特样品条形码富集期望样品。然后可对期望样品进行重新测序。

技术介绍

[0007]对于许多不同的应用,可能需要靶核酸的选定区域的文库产生。例如,在平台输出受到限制(例如PacBio、ONT或iSeq)的情况下,需要从基因组DNA的选定区域制备文库的能力。此外,当需要非常高的覆盖率时,诸如在液体活检样品中筛选罕见的体细胞突变,用于基因组DNA的选定区域的文库是有利的。
[0008]从基因组DNA的选定区域获得文库的当前方法包括基于寡核苷酸杂交的富集试剂盒(例如,TruSeq Exome、用于富集的Nextera Flex)。此外,最近已经公布了用于生成这种文库的基于CRISPR的系统。特别地,基于CRISPR的系统已经用于拉出10

100千碱基的区域,这适合于诸如PacBio和ONT的长读技术。
[0009]本公开描述了基因组DNA的期望区域的靶向文库制备的新方式。这些方法以多种独特的方式将不同的靶向技术与转座体结合。此外,本公开描述了从无细胞DNA(cfDNA)制备靶向文库而不需要在标签化之前移除组蛋白的方法。
[0010]本公开还描述了可用于解决在研究大量细胞群时难以确定的细胞差异的单细胞分析方法。稀有细胞的表征对于许多用途可能是重要的,诸如在肿瘤学(液体或肿瘤活检、最小残留疾病或早期疾病检测、肿瘤进化或肿瘤抗性)、免疫学(免疫或T细胞受体库)和宏基因组学(不可培养的生物体基因组组装)中。图1提供了可能感兴趣的宏基因组学和肿瘤学样品的一些代表性示例,其中稀有细胞是高度感兴趣的。目前的单细胞测序方法能够并行地对数百万个单细胞进行细胞分辨的

组学

表征,诸如研究单个细胞的基因组学、转录组学或表观基因组学特征部。
[0011]然而,在没有选择期望样品的情况下,群体中稀有细胞的基于测序的表征是昂贵且具有挑战性的。此外,基于细胞分选的富集方法基于可划分细胞特征部的可用性而受到限制。例如,FACS可富集某些细胞大小、形态和表面蛋白表达,但其他特征可能不能被FACS划分。基于特定的

组学

特征部富集细胞(例如基于物种、细胞类型或变体的存在的富集)将是非常有用的。这些特征部可以是先验地(基于现有技术)或从头(通过初始测序分析确定)已知的。通过对初始测序后鉴定为感兴趣的单细胞的样品进行重新测序来进行后续的、全面的/正交的

组学

表征也是非常有价值的。
[0012]本文公开了用于从“单细胞测序文库”或“sc文库”选择、富集和基于测序表征单个细胞的DNA文库的方法,该“单细胞测序文库”或“sc文库”由包含由不同单细胞生成的文库的多个细胞DNA文库组成。可进行sc

文库的初始测序(即,对来自单个细胞的所有DNA文库进行测序),并且可使用生物信息学分析来就感兴趣的特定

组学

特征部对单个细胞进行分选。使用该方法,通过独特细胞DNA条形码(UBC)鉴定由不同的单个细胞生成的文库。用于分选的

组学

特征部可用相对小的靶向测序组来定义细胞类型(例如表达、表观遗传模式或免疫基因重组)、物种类型(例如使用来自细菌的16s、18s或ITS rRNA/rDNA测序)或疾病状态/风险(例如癌症显著的种系或体细胞变体)。换句话讲,初始测序的足迹可能很小,并且重新测序可能更全面,但侧重于感兴趣的细胞。因此,本领域技术人员可使用单个初始测序运行来查询数百万或数十亿个细胞的示例性特征部,以将样品分选成期望样品和不需要的样品,随后对期望样品进行靶向重新测序。
[0013]另选地,可使用初始测序运行来鉴定用于后续分析的从头示例性

组学

细胞特征部。例如,初始测序运行可鉴定新的细胞特征部,然后可将该新的细胞特征部用于分选。
[0014]本方法中的富集或耗尽可通过已知的核酸靶标富集方法(例如杂交捕获、独特样品条形码特异性扩增或CRISPR消化)进行。然后可对来自感兴趣的细胞的单个细胞DNA进行重新测序并从完整的sc

文库中分离表征。因此,本方法可允许在用于分选细胞的初始测序运行之后进行更全面和/或正交的重新测序和分析。

技术实现思路

[0015]本公开描述了许多不同的靶向转座体复合物,其包含指导转座体复合物结合靶核酸中的一个或多个感兴趣的核酸序列的一个或多个元件。本文还描述了许多使用这些靶向转座体复合物的方法。
[0016]根据本说明书,还描述了一种表征包含期望样品和不需要的样品两者的样品混合池中的期望样品的方法。
[0017]实施方案1:一种靶向转座体复合物,包含转座酶;第一转座子,包含3'转座子末端序列;5'衔接子序列;以及用重组酶包被的靶向寡核苷酸,其中所述靶向寡核苷酸能够结合到一个或多个感兴趣的核酸序列;以及第二转座子,包含5'转座子末端序列,其中所述5'转座子末端序列与所述3'转座子末端序列互补。
[0018]实施方案2:根据实施方案1所述的转座体复合物,其中所述靶向寡核苷酸的序列与所述一个或多个感兴趣的核酸序列完全或部分互补。
[0019]实施方案3:根据实施方案1或2中任一项所述的转座体复合物,其中一个或多个靶向寡核苷酸连接至所述衔接子序列的5'端。
[0020]实施方案4:根据实施方案1至3中任一项所述的转座体复合物,其中一个或多个靶向寡核苷酸直接连接至所述衔接子序列的5'端。
[0021]实施方案5:根据实施方案1至4中任一项所述的转座体复合物,其中一个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种靶向转座体复合物,包含:a.转座酶;b.第一转座子,包含:i.3'转座子末端序列,ii.5'衔接子序列,以及c.与指导RNA缔合的无催化活性的内切核酸酶,其中所述指导RNA能够指导内切核酸酶结合到一个或多个感兴趣的核酸序列;以及d.第二转座子,包含所述转座子末端序列的互补序列。2.根据权利要求1所述的靶向转座体复合物,其中所述无催化活性的内切核酸酶来自蓝细菌贺氏伪枝藻属(ShCAST),任选地其中:a.所述gRNA和所述转座酶中的至少一者是生物素化的,并且其中生物素化的所述gRNA和所述转座酶中的至少一者能够与链霉抗生物素蛋白包被的小珠偶联;b.ShCAST包含Cas12K;c.所述转座酶包含Tn5或Tn7样转座酶;并且/或者d.所述第一转座子包含P5衔接子和P7衔接子中的至少一者。3.一种靶向转座体复合物,包含:a.转座酶,b.第一转座子,包含i.3'转座子末端序列;ii.5'衔接子序列;以及c.锌指DNA结合结构域,其中所述锌指DNA结合结构域能够结合到一个或多个感兴趣的核酸序列;以及d.第二转座子,包含所述转座子末端序列的互补序列。4.根据权利要求3所述的靶向转座体复合物,其中所述锌指DNA结合结构域包含在锌指核酸酶中,任选地其中所述锌指核酸酶是无催化活性的。5.根据权利要求3或4所述的靶向转座体复合物,其中所述一个或多个感兴趣的核酸序列包含在与组蛋白缔合的DNA中,任选地其中所述与组蛋白缔合的DNA是无细胞DNA。6.一种靶向生成靶核酸的带5'标签的片段的方法,包括:a.将包含双链核酸的样品和作为靶向转座体复合物的根据权利要求1至5中任一项所述的转座体复合物混合;以及b.通过将所述第一转座子的3'端接合到所述片段的5'端以产生多个带5'标签的片段,通过所述转座酶将所述核酸片段化成多个片段。7.一种生成带标签的核酸片段的文库的方法,包括:a.将包含双链核酸的样品、作为靶向转座体复合物的根据权利要求1至5中任一项所述的第一转座体复合物和第二转座体复合物混合,所述第二转座体复合物包含i.转座酶;ii.第一转座子,包含3'转座子末端序列和5'衔接子序列;以及iii.第二转座子,包含5'转座子末端序列,其中所述5'转座子末端序列与所述3'转座子末端序列互补;以及
b.通过将每个第一转座子的3'端接合到所述靶片段的5'端以产生由所述第一转座体复合物生成的多个第一带5'标签的靶片段和由所述第二转座体复合物生成的多个第二带5'标签的靶片段,通过所述转座酶将所述核酸片段化成多个片段。8.一种生成带标签的核酸片段的文库的方法,包括:a.将包含双链核酸的样品、作为靶向转座体复合物的根据权利要求1至5中任一项所述的第一转座体复合物和作为靶向转座体复合物的根据权利要求1至5中任一项所述的第二转座体复合物混合;以及b.通过将每个第一转座子的3'端接合到所述靶片段的5'端以产生由所述第一转座体复合物生成的多个第一带5'标签的靶片段和由所述第二转座体复合物生成的多个第二带5'标签的靶片段,通过所述转座酶将所述核酸片段化成多个片段。9.根据权利要求6至8中任一项所述的方法,其中将包含双链核酸的样品与一种或多种靶向的转座体复合物混合包括:a.将所述样品与锌指DNA结合结构域或无催化活性的内切核酸酶混合,其中所述锌指DNA结合结构域或无催化活性的内切核酸酶结合到第一结合配偶体,以及b.添加所述转座酶以及第一转座子和第二转座子,其中所述转座酶结合到第二结合配偶体,其中所述转座酶能够通过所述第一结合配偶体和第二结合配偶体的配对结合到所述锌指DNA结合结构域或无催化活性的内切核酸酶。10.一种靶向转座体复合物,包含:a.转座酶,b.第一转座子,包含i.3'转座子末端序列;ii.5'衔接子序列;以及iii.用重组酶包被的靶向寡核苷酸,其中所述靶向寡核苷酸能够结合到一个或多个感兴趣的核酸序列;以及c.第二转座子,包含5'转座子末端序列,其中所述5'转座子末端序列与所述3'转座子末端序列互补。11.根据权利要求10所述的转座体复合物,其中所述靶向寡核苷酸的序列与所述一个或多个感兴趣的核酸序列完全或部分互补并且/或者其中所述重组酶是UVSX、Rec233或RecA。12.一种试剂盒或组合物,包含作为靶向转座体复合物的根据权利要求10或权利要求11所述的第一转座体复合物和第二转座体复合物,所述第二转座体复合物包含:i.转座酶;ii.第一转座子,包含3'转座子末端序列和5'衔接子序列;以及iii.第二转座子,包含5'转座子末端序列,其中所述5'转座子末端序列与所述3'转座子末端序列互补。13.一种靶向生成靶核酸的带5'标签的片段的方法,包括:a.将包含双链核酸的样品和作为靶向转座体复合物的根据权利要求10或11所述的转座体复合物混合;b.通过所述重组酶启动所述核酸的链侵入;以及
c.通过将所述第一转座子的3'端接合到所述片段的5'端以产生多个带5'标签的片段,通过所述转座酶将所述核酸片段化成多个片段。14.一种生成带标签的核酸片段的文库的方法,包括:a.将包含双链核酸的样品、作为靶向转座体复合物的根据权利要求10或11所述的第一转座体复合物和第二转座体复合物混合,所述第二转座体复合物包含i.转座酶;ii.第一转座子,包含3'转座子末端序列和5'衔接子序列;以及iii.第二转座子,包含5'转座子末端序列,其中所述5'转座子末端序列与所述3'转座子末端序列互补;b.通过所述重组酶启动所述核酸的链侵入;以及c.通过将每个第一转座子的3'端接合到所述靶片段的5'端以产生由所述第一转座体复合物生成的多个第一带5'标签的靶片段和由所述第二转座体复合物生成的多个第二带5'标签的靶片段,通过所述转座酶将所述核酸片段化成多个片段。15.一种生成带标签的核酸片段的文库的方法,包括:a.将包含双链核酸的样品、作为靶向转座体复合物的根据权利要求10或11所述的第一转座体复合物和作为靶向转座体复合物的根据权利要求...

【专利技术属性】
技术研发人员:弗兰克
申请(专利权)人:ILLUMINA剑桥有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1