用于甲基化测序的单细胞全基因组文库制造技术

技术编号:23774031 阅读:36 留言:0更新日期:2020-04-12 02:48
本文提供了制备用于确定来自多个单细胞的核酸的甲基化状态的测序文库的方法。本发明专利技术方法将分开‑合并式组合指标化与亚硫酸氢盐处理技术组合,以快速、准确并且廉价地表征大量单细胞的甲基化概况。

Single cell whole genome library for methylation sequencing

【技术实现步骤摘要】
【国外来华专利技术】用于甲基化测序的单细胞全基因组文库相关申请的交叉引用本申请要求于2017年6月7日提交的美国临时申请序列号62/516,324的权益,通过引用将其结合在此。
本披露内容的实施例涉及对核酸进行测序。具体而言,本文提供的方法和组合物的实施例涉及产生单细胞亚硫酸氢盐测序文库并且从中获得序列数据。
技术介绍
高细胞计数单细胞测序已经显示出其经由转录组、染色质-可及性和突变差异在复杂组织内的群体分离中的效率。此外,单细胞分辨率已经允许以基因组特异性模式(例如DNA的甲基化)来评估细胞分化的轨迹。DNA甲基化是胞嘧啶的共价加成;具有细胞类型特异性的标记,其是发育的组织中进行主动修饰的对象。可以使用亚硫酸氢钠处理的脱氨化学以碱基对的分辨率探测DNA甲基化。最近的工作已经优化了亚硫酸氢盐测序,甚至在单细胞还原简约表示亚硫酸氢盐测序(scRRBS)或单细胞全基因组亚硫酸氢盐测序(scWGBS)中需要单细胞输入。然而,这些方法缺乏可扩缩性,依赖于经由并行和分离的文库产生的单细胞解卷积,其中单细胞反应是在分离中进行的。对于每个细胞测序均需要一套全新的试剂,导致每个额外细胞的成本的线性扩缩。由于DNA的亚硫酸氢盐转化的挑战,对于单细胞亚硫酸氢盐测序,没有采用基于液滴或芯片的微流体系统,也不存在使用替代平台的任何理论上可行的策略。
技术实现思路
本文提供了组合物和可扩缩的高细胞计数、单细胞甲基化组剖析测定。通过本文提供的单细胞组合指标化策略改善了单细胞全基因组测序(scWGBS),因此可以批量处理细胞,并且可以在计算机上(insilico)对单细胞输出进行多路分解(demultiplexed)。在一些实施例中,本文提供的方法利用了基于转座酶的衔接子的掺入,与现有方法相比,该方法导致提高的效率以及更高的比对率。使用转座酶附加两个测序衔接子之一可以使文库构建更高效并且噪声读段更低,因此得到当与使用单细胞单孔方法的10%-30%相比时约60%的比对率(与大量细胞策略相似的比率)。这样可以得到更有用的序列读段,并且大大降低测定的测序部分的成本。使用单细胞组合指标化策略产生单细胞亚硫酸氢盐测序文库展示于具有最小冲突比率的人细胞与小鼠细胞的混合物中。还展示了三种人类细胞类型的混合物的成功解卷积,并且使用公开可用的数据实现了细胞类型分配。定义如本文所用,术语“生物体”、“受试者”可互换使用并且是指动物和植物。动物的实例是哺乳动物,如人类。如本文所用,术语“细胞类型”旨在基于形态、表型、发育起源或其他已知或可识别的区别性细胞特征来鉴定细胞。可以从单个生物体(或从相同的生物体物种)获得多种不同的细胞类型。示例性细胞类型包括但不限于膀胱细胞、胰上皮细胞、胰α细胞、胰β细胞、胰内皮细胞、骨髓成淋巴细胞、骨髓B成淋巴细胞、骨髓巨噬细胞、骨髓成红细胞、骨髓树突细胞、骨髓脂肪细胞、骨髓骨细胞、骨髓软骨细胞、成早幼粒细胞(promyeloblast)、骨髓成巨核细胞、膀胱细胞、脑B淋巴细胞、脑神经胶质细胞、神经元细胞、脑星形胶质细胞、神经外胚层细胞、脑巨噬细胞、脑小神经胶质细胞、脑上皮细胞、皮质神经元细胞、脑成纤维细胞、乳腺上皮细胞、结肠上皮细胞、结肠B淋巴细胞、乳腺上皮细胞、乳腺肌上皮细胞、乳腺成纤维细胞、结肠肠上皮细胞、子宫颈上皮细胞、卵巢上皮细胞、卵巢成纤维细胞、乳腺导管上皮细胞、舌上皮细胞、扁桃体树突细胞、扁桃体B淋巴细胞、外周血成淋巴细胞、外周血T成淋巴细胞、外周血皮肤T淋巴细胞、外周血自然杀伤细胞、外周血B成淋巴细胞、外周血单核细胞、外周血成粒细胞、外周血成单核细胞、外周血成早幼粒细胞、外周血巨噬细胞、外周血嗜碱性粒细胞、肝内皮细胞、肝肥大细胞、肝上皮细胞、肝B淋巴细胞、脾内皮细胞、脾上皮细胞、脾B淋巴细胞、肝细胞、肝亚历山大细胞(liverAlexander)、肝成纤维细胞、肺上皮细胞、支气管上皮细胞、肺成纤维细胞、肺B淋巴细胞、肺施旺细胞(lungSchwann)、肺鳞状细胞、肺巨噬细胞、肺成骨细胞、神经内分泌细胞、肺泡细胞、胃上皮细胞和胃成纤维细胞。如本文所用,术语“组织”旨在意指共同作用以在生物体中执行一种或多种特定功能的细胞的集合或聚集。这些细胞可以任选地形态相似。示例性组织包括但不限于眼、肌肉、皮肤、肌腱、静脉、动脉、血液、心、脾、淋巴结、骨骼、骨髓、肺、支气管、气管、肠、小肠、大肠、结肠、直肠、唾液腺、舌、胆囊、阑尾、肝、胰腺、脑、胃、皮肤、肾脏、输尿管、膀胱、尿道、性腺、睾丸、卵巢、子宫、输卵管、胸腺、垂体、甲状腺、肾上腺或甲状旁腺。组织可以衍生自人类或其他生物体的多种器官中的任一种。组织可以是健康组织或不健康组织。不健康组织的实例包括但不限于甲基化异常的多种恶性肿瘤,例如,肺、乳腺、结肠直肠、前列腺、鼻咽、胃、睾丸、皮肤、神经系统、骨骼、卵巢、肝脏、血液组织、胰腺、子宫、肾、淋巴组织等中的恶性肿瘤。这些恶性肿瘤可以是多种组织学亚型,例如癌、腺癌、肉瘤、纤维腺癌、神经内分泌癌或未分化的癌。如本文所使用的,术语“区室”旨在意指将某物与其他事物分开或分离的区域或容积。示例性区室包括但不限于小瓶、管、孔、液滴、丸、珠、容器、表面特征或由诸如流体流、磁性、电流等的物理力分开的区域或容积。在一个实施例中,区室是多孔板(例如96孔板或384孔板)的孔。如本文所用,“转座体复合物”是指整合酶和包括整合识别位点的核酸。“转座体复合物”是由转座酶和转座酶识别位点形成的功能性复合物,其能够催化转座反应(参见,例如,Gunderson等人,WO2016/130704)。整合酶的实例包括但不限于诸如整合酶或转座酶。整合识别位点的实例包括但不限于转座酶识别位点。如本文所用,术语“核酸”旨在与其在本领域中的用途一致,并且包括天然存在的环核酸或其功能类似物。特别有用的功能类似物能够以序列特异性方式与核酸杂交,或者能够用作特定核苷酸序列的复制的模板。天然存在的核酸通常具有含有磷酸二酯键的骨架。类似物结构可能具有替代的骨架连接,包括本领域已知的各种骨架连接中的任一种。天然存在的核酸通常具有脱氧核糖(例如在脱氧核糖核酸(DNA)中发现)或核糖(例如在核糖核酸(RNA)中发现)。核酸可能含有本领域已知的这些糖部分的多种类似物中的任一种。核酸可以包括天然或非天然碱基。就这一点而言,天然脱氧核糖核酸可以具有一种或多种选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的碱基,以及核糖核酸可以具有一种或多种选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的碱基。可以包括在核酸中的有用的非天然碱基是本领域已知的。非天然碱基的实例包括锁核酸(LNA)和桥核酸(BNA)。可将LNA和BNA碱基掺入DNA寡核苷酸中,并且增加寡核苷酸杂交的强度和特异性。LNA和BNA碱基和此类碱基的使用是本领域技术人员已知的并且是常规的。如本文所用,术语“靶标”当关于核酸使用时,旨在在本文列出的方法或化合物的情况下作为核酸的语义标识符,并且除非另有明确说明,否则不一定限制该核酸的结构或功能。靶核酸可以是具有已知或未知序列的基本上任何核酸。它可以是例本文档来自技高网...

【技术保护点】
1.一种制备用于确定来自多个单细胞的核酸的甲基化状态的测序文库的方法,该方法包括:/n(a)提供来自多个细胞的分离的细胞核;/n(b)使这些分离的细胞核经历化学处理以产生耗尽核小体的细胞核,同时保持这些分离的细胞核的完整性;/n(c)将这些耗尽核小体的细胞核的子集分配到包含转座体复合物的第一多个区室中,其中每个区室中的该转座体复合物包含与其他区室中的第一指标序列不同的第一指标序列;/n(d)将耗尽核小体的细胞核的这些子集中的核酸片段化为多个核酸片段,并且将这些第一指标序列掺入这些核酸片段的至少一条链中,以产生指标化细胞核;/n(e)将这些指标化细胞核组合以产生合并的指标化细胞核;/n(f)将这些合并的指标化细胞核的子集分配到第二多个区室中,并且使这些指标化细胞核经历亚硫酸氢盐处理,以产生经亚硫酸氢盐处理的核酸片段;/n(g)通过使用多个引物的线性扩增来扩增每个区室中的这些经亚硫酸氢盐处理的核酸片段以产生扩增的片段-衔接子分子,这些引物在5'末端包含通用核苷酸序列,并且在3'末端包含随机核苷酸序列;/n(h)将第二指标序列掺入这些扩增的片段-衔接子分子中以产生双指标片段-衔接子分子,其中在每个区室中的该第二指标序列不同于其他区室中的第二指标序列;以及/n(i)将这些双指标片段-衔接子分子组合,从而产生用于确定来自该多个单细胞的核酸的甲基化状态的测序文库。/n...

【技术特征摘要】
【国外来华专利技术】20170607 US 62/516,3241.一种制备用于确定来自多个单细胞的核酸的甲基化状态的测序文库的方法,该方法包括:
(a)提供来自多个细胞的分离的细胞核;
(b)使这些分离的细胞核经历化学处理以产生耗尽核小体的细胞核,同时保持这些分离的细胞核的完整性;
(c)将这些耗尽核小体的细胞核的子集分配到包含转座体复合物的第一多个区室中,其中每个区室中的该转座体复合物包含与其他区室中的第一指标序列不同的第一指标序列;
(d)将耗尽核小体的细胞核的这些子集中的核酸片段化为多个核酸片段,并且将这些第一指标序列掺入这些核酸片段的至少一条链中,以产生指标化细胞核;
(e)将这些指标化细胞核组合以产生合并的指标化细胞核;
(f)将这些合并的指标化细胞核的子集分配到第二多个区室中,并且使这些指标化细胞核经历亚硫酸氢盐处理,以产生经亚硫酸氢盐处理的核酸片段;
(g)通过使用多个引物的线性扩增来扩增每个区室中的这些经亚硫酸氢盐处理的核酸片段以产生扩增的片段-衔接子分子,这些引物在5'末端包含通用核苷酸序列,并且在3'末端包含随机核苷酸序列;
(h)将第二指标序列掺入这些扩增的片段-衔接子分子中以产生双指标片段-衔接子分子,其中在每个区室中的该第二指标序列不同于其他区室中的第二指标序列;以及
(i)将这些双指标片段-衔接子分子组合,从而产生用于确定来自该多个单细胞的核酸的甲基化状态的测序文库。


2.如权利要求1所述的方法,其中该化学处理包括用能够破坏核酸-蛋白质相互作用的离液剂进行的处理。


3.如权利要求2所述的方法,其中该离液剂包含二碘水杨酸锂。


4.如权利要求1所述的方法,其中该化学处理包括用能够破坏核酸-蛋白质相互作用的去污剂进行的处理。


5.如权利要求4所述的方法,其中该去污剂包含十二烷基硫酸钠(SDS)。


6.如权利要求5所述的方法,其中在步骤(a)之前,将这些细胞用交联剂处理。


7.如权利要求6所述的方法,其中该交联剂是甲醛。


8.如权利要求1所述的方法,其中步骤(c)和(f)中的该分配是通过荧光激活的细胞核分选进行的。


9.如权利要求1所述的方法,其中这些耗尽核小体的细胞核的子集包括大致相等的细胞核数。


10.如权利要求9所述的方法,其中这些耗尽核小体的细胞核的子集包括从1到约2000个细胞核。


11.如权利要求1所述的方法,其中该第一多个区室是多孔板。


12.如权利要求11所述的方法,其中该多孔板是96孔板或384孔板。


13.如权利要求1所述的方法,其中这些合并的指标化细胞核的子集包括大致相等的细胞核数。


14.如权利要求13所述的方法,其中这些合并的指标化细胞核的子集包括从1到约25个细胞核。


15.如权利要求1所述的方法,其中这些合并的指标化细胞核的子集包括比这些耗尽核小体的细胞核的子集少至少10倍的细胞核。


16.如权利要求1所述的方法,其中这些合并的指标化细胞核的子集包括比这些耗尽核小体的细胞核的子集少至少100倍的细胞核。


17.如权利要求1所述的方法,其中该第二多个区室是多孔板。


18.如权利要求17所述的方法,其中该多孔板是96孔板或384孔板。


19.如权利要求1所述的方法,其中这些转座体复合物各自包含转座酶和转座子,这些转座子各自包含转移链。


20.如权利要求19所述的方法,其中该转移链不包含胞嘧啶残基。


21.如权利要求20所述的方法,其中该转移链包含该第一指标序列。


22.如权利要求21所述的方法,其中该转移链还包含第一通用序列和第一测序引物序列。


23.如权利要求1所述的方法,其中该亚硫酸氢盐处理将CpG二核苷酸的未甲基化的胞嘧啶残基转化为尿嘧啶残基,并且使5-甲基胞嘧啶残基保持不变。


24.如权利要求1所述的方法,其中这些经亚硫酸氢盐处理的核酸片段的线性扩增包括1至10个循环。


25.如权利要求1所述的方法,其中步骤(g)中位于这些引物5'末端的该通用核苷酸序列包含第二测序引物序列。


26.如权利要求1所述的方法,其中步骤(g)中位于这些引物3'末端的该随机核苷酸序列由9个随机的核苷酸组成。


27.如权利要求1所述的方法,其中步骤(h)中该第二指标序列的掺入包括使每个区室中的这些扩增的片段-衔接子分子与各自包含指标序列的第一通用引物和第二通用引物接触,并且进行指数扩增反应。


28.如权利要求27所述的方法,其中该第一通用引物的指标序列是该第二通用引物的指标序列的反向补体。


29.如权利要求27所述的方法,其中该第一通用引物的指标序列与该第二通用引物的指标序列的反向补体不同。


30.如权利要求27所述的方法,其中该第一通用引物还包含第一捕获序列和与位于这些扩增的片段-衔接子分子3'末端的通用序列互补的第一锚定序列。


31.如权利要求30所述的方法,其中该第一捕获序列包含P5引物序列。


32.如权利要求27所述的方法,其中该第二通用引物还包含第二捕获序列和与位于这些扩增的片段-衔接子分子5'末端的通用序列互补的第二锚定序列。


33.如权利要求32所述的方法,其中该第二捕获序列包含P7引物序列的反向补体。


34.如权利要求27所述的方法,其中该指数扩增反应包括聚合酶链反应(PCR)。


35.如权利要求34所述的方法,其中该PCR包括15至30个循环。


36.如权利要求1所述的方法,该方法还包括使用对靶核酸具有特异性的多个捕获寡核苷酸富集这些靶核酸。


37.如权利要求36所述的方法,其中将这些捕获寡核苷酸固定在固体衬底的表面上。


38.如权利要求36所述的方法,其中这些捕获寡核苷酸包含通用结合对的第一成员,并且其中将该结合对的第二成员固定在固体衬底的表面上。


39.如权利要求1所述的方法,该方法还包括选择落入预定大小范围内的这些双指标片段-衔接子分子。


40.如权利要求1所述的方法,该方法还包括对这些双指标片段-衔接子分子进行测序,以确定来自该多个单细胞的核酸的甲基化状态。


41.一种制备用于确定来自多个单细胞的核酸的甲基化状态的测序文库的方法,该方法包括:
(a)提供来自多个细胞的分离的细胞核;
(b)使这些分离的细胞核经历化学处理以产生耗尽核小体的细胞核,同时保持这些分离的细胞核的完整性;
(c)将这些耗尽核小体的细胞核的子集分配到包含转座体复合物的第一多个区室中,其中每个区室中的该转座体复合物包含与其他区室中的第一指标序列不同的第一指标序列;
(d)将这些耗尽核小体的细胞核的子集中的核酸片段化为多个核酸片段,并且将这些第一指标序列掺入这些核酸片段的至少一条链中,以产生指标化细胞核;
(e)将这些指标化细胞核组合以产生合并的指标化细胞核;
(f)将这些合并的指标化细胞核的子集分配到第二多个区室中,并且使这些指标化细胞核经历亚硫酸氢盐处理,以产生经亚硫酸氢盐处理的核酸片段;
(g)将每个区室中的这些经亚硫酸氢...

【专利技术属性】
技术研发人员:A·C·艾迪R·穆奎恩F·J·斯蒂默斯D·K·波克洛克S·诺伯格
申请(专利权)人:俄勒冈健康科学大学伊鲁米那股份有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1