【技术实现步骤摘要】
【国外来华专利技术】使用基因表达和染色质可接近性表征细胞的方法
[0001]相关申请的交叉引用
[0002]本申请要求2020年2月13日提交的美国临时专利申请第62/976,270号、2020年2月21日提交的美国临时专利申请第62/979,986号、2020年11月16日提交的美国临时专利申请第63/114,378号和2020年12月14日提交的美国临时专利申请第63/125,331号的权益,所述申请各自出于所有目的以引用的方式整体并入本文。
技术介绍
[0003]虽然用于在单细胞分辨率下测定转录或染色质可接近性(例如,使用ATAC
‑
seq)的稳健高通量系统现在很普遍,但研究人员和临床医生通常必须拆分细胞样品并单独分析每种模态,并通过计算推断基因表达和染色质可接近性数据之间的关联。
技术实现思路
[0004]在一些实施方案中,本文公开了用于表征细胞或细胞核的方法。在一个方面,本公开提供了一种用于表征细胞或细胞核的方法,所述方法包括:提供包含多个细胞或细胞核和多个颗粒的多个分区,其中所述多个分区中的分区包含所述多个细 ...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于表征细胞或细胞核的方法,所述方法包括:(a)提供包含多个细胞或细胞核和多个颗粒的多个分区,其中所述多个分区中的分区包含所述多个细胞或细胞核中的细胞或细胞核和所述多个颗粒中的颗粒,其中(i)所述多个细胞或细胞核包含多个核酸分子,其中所述多个核酸分子包含多个核糖核酸(RNA)分子和多个脱氧核糖核酸(DNA)分子;并且(ii)所述多个颗粒包含偶联至所述多个颗粒的多个核酸条形码分子,其中所述多个核酸条形码分子中的核酸条形码分子包含多个核酸条形码序列中的核酸条形码序列,并且其中所述颗粒包含所述多个核酸条形码序列中的独特核酸条形码序列;(b)在所述多个分区内,使用所述多个核酸条形码分子中的核酸条形码分子和所述多个核酸分子中的核酸分子产生多个条形码化核酸分子,其中所述多个条形码化核酸分子包含(i)包含对应于所述多个RNA分子中的RNA分子的序列的第一子集和(ii)包含对应于所述多个DNA分子中的DNA分子的序列的第二子集,其中所述多个条形码化核酸分子中的条形码化核酸分子包含对应于所述多个核酸条形码序列中的核酸条形码序列的序列;(c)处理所述多个条形码化核酸分子或其衍生物以产生对应于所述RNA分子和所述DNA分子的序列信息;以及(d)使用所述序列信息来鉴定所述多个细胞或细胞核的特征。2.如权利要求1所述的方法,其中所述多个细胞或细胞核的所述特征包括细胞类型。3.如权利要求2所述的方法,其中所述细胞类型选自由单核细胞、自然杀伤细胞、B细胞、T细胞、粒细胞、树突细胞和基质细胞组成的组。4.如权利要求3所述的方法,其中所述B细胞选自由复制B细胞、正常B细胞和肿瘤B细胞组成的组。5.如权利要求3或4所述的方法,其中所述B细胞选自由幼稚B细胞、记忆B细胞、浆母细胞B细胞、淋巴浆细胞样细胞、B
‑
1细胞、调节性B细胞和浆B细胞组成的组。6.如权利要求3
‑
5中任一项所述的方法,其中所述T细胞选自由复制T细胞和正常T细胞组成的组。7.如权利要求3
‑
6中任一项所述的方法,其中所述T细胞选自由辅助T细胞、细胞毒性T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关不变型T(MAIT)细胞、γδT细胞、效应T细胞和幼稚T细胞组成的组。8.如权利要求3
‑
7中任一项所述的方法,其中所述单核细胞选自由以CD14细胞表面受体的高水平表达为特征的单核细胞和以CD16细胞表面受体的高水平表达为特征的单核细胞组成的组。9.如权利要求3
‑
8中任一项所述的方法,其中所述树突细胞选自由常规树突细胞和浆细胞样树突细胞组成的组。10.如权利要求1
‑
9中任一项所述的方法,其中对应于所述多个DNA分子中的所述DNA分子的所述序列对应于可接近染色质区域。11.如权利要求1
‑
10中任一项所述的方法,其中所述多个RNA分子中的所述RNA分子包括信使RNA(mRNA)分子。12.如权利要求1
‑
11中任一项所述的方法,其中所述序列信息包含对应于所述DNA分子的第一多个测序读段和对应于所述RNA分子的第二多个测序读段。
13.如权利要求1
‑
12中任一项所述的方法,其中所述序列信息包含与所述多个细胞或细胞核中的个别细胞或细胞核相关的多个测序读段。14.如权利要求1
‑
13中任一项所述的方法,其中(d)包括使用所述序列信息确定所述多个细胞或细胞核中的所述细胞或细胞核的关联特征,所述细胞或细胞核的所述关联特征将包含对应于所述细胞或细胞核的DNA分子的序列信息的第一数据集和包含对应于所述细胞或细胞核的RNA分子的序列信息的第二数据集关联起来。15.如权利要求1
‑
14中任一项所述的方法,其中(d)包括使用所述序列信息依据基因表达特征和/或依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类。16.如权利要求1
‑
13中任一项所述的方法,其中(d)包括(i)使用所述序列信息依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,(ii)使用所述序列信息依据基因表达特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,以及(iii)使用所述序列信息和依据所述基因表达特征聚类的所述细胞或细胞核进一步表征依据所述可接近染色质区域聚类的所述细胞或细胞核。17.如权利要求1
‑
13中任一项所述的方法,其中(d)包括(i)使用所述序列信息依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,(ii)使用所述序列信息依据基因表达特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,以及(iii)使用所述序列信息和依据所述可接近染色质区域特征聚类的所述细胞或细胞核进一步表征依据所述基因表达特征聚类的所述细胞或细胞核。18.如权利要求1
‑
17中任一项所述的方法,其中所述多个细胞或细胞核源自包含肿瘤或疑似包含肿瘤的样品。19.如权利要求18所述的方法,所述方法还包括将对应于所述RNA分子和所述DNA分子的所述序列信息与从对照样品产生的序列信息进行处理。20.如权利要求18所述的方法,其中所述样品源自体液。21.如权利要求18所述的方法,其中所述样品源自活检物。22.如权利要求18
‑
21中任一项所述的方法,其中所述肿瘤是B细胞淋巴瘤肿瘤。23.如权利要求18
‑
22中任一项所述的方法,所述方法还包括使用所述序列信息来鉴定所述样品中肿瘤细胞或细胞核的存在。24.如权利要求18
‑
23中任一项所述的方法,所述方法还包括(e)使用所述序列信息来鉴定所述样品中的细胞类型、细胞状态、肿瘤特异性基因表达模式或肿瘤特异性差异性可接近染色质区域。25.如权利要求24所述的方法,所述方法还包括至少部分地基于(e)确定用于治疗所述样品所源自的受试者的治疗方案。26.如权利要求25所述的方法,其中所述治疗方案包括施用治疗有效量的靶向以所述肿瘤特异性基因表达模式或所述肿瘤特异性差异性可接近染色质区域鉴定的一个或多个靶标的剂。27.如权利要求1
‑
26中任一项所述的方法,其中所述多个分区包括多个液滴。28.如权利要求1
‑
27中任一项所述的方法,其中所述多个细胞或细胞核包括多个转座核。
29.如权利要求1
‑
28中任一项所述的方法,其中所述多个颗粒包括多个凝胶珠粒。30.如权利要求29所述的方法,其中所述多个核酸条形码分子可释放地偶联至所述多个颗粒。31.如权利要求30所述的方法,其中所述多个核酸条形码分子中的核酸条形码分子在施加刺激时能够从所述多个颗粒中的所述颗粒释放。32.如权利要求31所述的方法,其中所述刺激是化学刺激。33.如权利要求32所述的方法,其中所述刺激包括还原剂。34.如权利要求29所述的方法,其中所述多个核酸条形码分子通过多个不稳定部分偶联至所述多个颗粒。35.如权利要求1
‑
34中任一项所述的方法,所述方法还包括使用微流控装置产生所述多个分区。36.如权利要求1
‑
35中任一项所述的方法,所述方法还包括从所述多个分区的所述至少所述子集回收所述多个条形码化核酸分子。37.如权利要求1
‑
36中任一项所述的方法,所述方法还包括在(b)之前溶解或透化所述多个细胞或细胞核以接近其中的所述多个核酸分子。38.如权利要求1
‑
37中任一项所述的方法,所述方法还包括在(a)之前用转座酶处理所述多个细胞或细胞核的开放染色质结构以提供所述多个DNA分子。39.如权利要求1
‑
38中任一项所述的方法,所述方法还包括在所述多个分区的所述至少所述子集内逆转录所述多个RNA分子以提供多个互补DNA(cDNA)分子。40.一种用于鉴定遗传特征的方法,所述方法包括:(a)提供对应于多个细胞或细胞核的多个脱氧核糖核酸(DNA)分子的可接近染色质区域的第一数据集和对应于所述多个细胞或细胞核的多个核糖核酸(RNA)分子的第二数据集,其中所述第一数据集包含对应于所述可接近染色质区域的序列和多个核酸条形码序列的第一多个测序读段,并且其中所述第二数据集包含对应于所述多个RNA分子的序列和所述多个核酸条形码序列的第二多个测序读段,其中所述多个细胞或细胞核中的细胞或细胞核对应于所述多个核酸条形码序列中的核酸条形码序列;(b)使用所述第一数据集和所述第二数据集的所述多个核酸条形码序列将所述第一多个测序读段中的第一测序读段和所述第二多个测序读段中的第二测序读段鉴定为对应于所述多个细胞或细胞核中的细胞或细胞核,由此产生包含对应于与所述多个细胞或细胞核中的细胞或细胞核相关的可接近染色质区域和RNA分子的序列信息的第三数据集;(c)使用所述序列信息来鉴定所述细胞或细胞核的细胞类型;(d)使用对应于所述RNA分子的所述序列信息来鉴定所述细胞类型中的细胞类型的表达蛋白;以及(e)使用对应于所述可接近染色质区域的所述序列信息来鉴定对应于所述表达蛋白的遗传特征。41.如权利要求40所述的方法,其中所述细胞类型选自由单核细胞、自然杀伤细胞、B细胞、T细胞、粒细胞、树突细胞和基质细胞组成的组。42.如权利要求41所述的方法,其中所述B细胞选自由复制B细胞、正常B细胞和肿瘤B细胞组成的组。
43.如权利要求41或42所述的方法,其中所述B细胞选自由幼稚B细胞、记忆B细胞、浆母细胞B细胞、淋巴浆细胞样细胞、B
‑
1细胞、调节性B细胞和浆B细胞组成的组。44.如权利要求41
‑
43中任一项所述的方法,其中所述T细胞选自由复制T细胞和正常T细胞组成的组。45.如权利要求41
‑
44中任一项所述的方法,其中所述T细胞选自由辅助T细胞、细胞毒性T细胞、记忆T细胞、调节性T细胞、自然杀伤T细胞、粘膜相关不变型T(MAIT)细胞、γδT细胞、效应T细胞和幼稚T细胞组成的组。46.如权利要求41
‑
45中任一项所述的方法,其中所述单核细胞选自由以CD14细胞表面受体的高水平表达为特征的单核细胞和以CD16细胞表面受体的高水平表达为特征的单核细胞组成的组。47.如权利要求41
‑
46中任一项所述的方法,其中所述树突细胞选自由常规树突细胞和浆细胞样树突细胞组成的组。48.如权利要求40
‑
47中任一项所述的方法,其中所述多个细胞或细胞核包含至少500个细胞或细胞核。49.如权利要求48所述的方法,其中所述多个细胞或细胞核包含至少1,000个细胞或细胞核。50.如权利要求49所述的方法,其中所述多个细胞或细胞核包含至少10,000个细胞或细胞核。51.如权利要求40
‑
50中任一项所述的方法,其中所述遗传特征是顺式调控元件。52.如权利要求51所述的方法,其中所述顺式调控元件是启动子。53.如权利要求51所述的方法,其中所述顺式调控元件是增强子。54.如权利要求40
‑
53中任一项所述的方法,其中所述表达蛋白是细胞因子。55.如权利要求40
‑
54中任一项所述的方法,其中所述多个RNA分子包括多个信使RNA (mRNA)分子。56.如权利要求40
‑
55中任一项所述的方法,所述方法还包括使用所述第一数据集和所述第二数据集确定所述多个细胞或细胞核中的所述细胞或细胞核的关联特征,所述细胞或细胞核的所述关联特征将包含对应于所述细胞或细胞核的DNA分子的序列信息的第四数据集和包含对应于所述细胞或细胞核的RNA分子的序列信息的第五数据集关联起来。57.如权利要求40
‑
56中任一项所述的方法,其中(c)包括使用所述序列信息依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类。58.如权利要求40
‑
56中任一项所述的方法,其中(c)包括使用所述序列信息依据基因表达特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类。59.如权利要求40
‑
56中任一项所述的方法,其中(c)包括(i)使用所述序列信息依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,(ii)使用所述序列信息依据基因表达特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,以及(iii)使用所述序列信息和依据所述基因表达特征聚类的所述细胞或细胞核进一步表征依据所述可接近染色质区域聚类的所述细胞或细胞核。60.如权利要求40
‑
56中任一项所述的方法,其中(c)包括(i)使用所述序列信息依据可接近染色质区域特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,(ii)使用所述
序列信息依据基因表达特征对所述多个细胞或细胞核中的细胞或细胞核进行聚类,以及(iii)使用所述序列信息和依据所述可接近染色质区域特征聚类的所述细胞或细胞核进一步表征依据所述基因表达特征聚类的所述细胞或细胞核。61.如权利要求40
‑
60中任一项所述的方法,其中所述多个细胞或细胞核源自包含肿瘤或疑似包含肿瘤的样品。62.如权利要求61所述的方法,其中所述样品源自体液。63.如权利要求61所述的方法,其中所述样品源自活检物。64.如权利要求61
‑
63中任一项所述的方法,其中所述肿瘤是B细胞淋巴瘤肿瘤。65.如权利要求61
‑
64中任一项所述的方法,所述方法还包括使用所述序列信息来鉴定所述样品中肿瘤细胞或细胞核的存在。66.如权利要求61
‑
65中任一项所述的方法,所述方法还包括(f)使用所述序列信息来鉴定所述样品中的细胞类型、细胞状态、肿瘤特异性基因表达模式或肿瘤特异性差异性可接近染色质区域。67.如权利要求66所述的方法,所述方法还包括至少部分地基于(f)确定用于治疗所述样品所源自的受试者的治疗方案。68.如权利要求67所述的方法,其中所述治疗方案包括施用治疗有效量的靶向以所述肿瘤特异性基因表达模式或所述肿瘤特异性差异性可接近染色质区域鉴定的一个或多个靶标的剂。69.一种用于鉴定遗传特征的系统,所述系统包括:一个或多个数据库,所述一个或多个数据库包含对应于多个细胞或细胞核的多个脱氧核糖核酸(DNA)分子的可接近染色质区域的第一数据集和对应于所述多个细胞或细胞核的多个核糖核酸(RNA)分子的第二数据集,其中所述第一数据集包含对应于所述可接近染色质区域的序列和多个核酸条形码序列的第一多个测序读段,并且其中所述第二数据集包含对应于所述多个RNA分子的序列和所述多个核酸条形码序列的第二多个测序读段,其中所述多个细胞或细胞核中的细胞或细胞核对应于所述多个核酸条形码序列中的核酸条形码序列;和一个或多个计算机处理器,所述一个或多个计算机处理器可操作地耦合至所述一个或多个数据库,其中所述一个或多个计算机处理器单独地或共同地被编程为:(i)使用所述第一数据集和所述第二数据集的所述多个核酸条形码序列将所述第一多个测序读段中的第一测序读段和所述第二多个测序读段中的第二测序读段鉴定为对应于所述多个细胞或细胞核中的细胞或细胞核,由此产生包含对应于与所述多个细胞或细胞核中的细胞或细胞核相关的可接近染色质区域和RNA分子的序列信息的第三数据集;(ii)使用所述序列信息来鉴定所述细胞或细胞核的细胞类型;(iii)使用对应于...
【专利技术属性】
技术研发人员:阿伦德赫蒂,
申请(专利权)人:一零X基因组学有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。