一种单细胞全长转录本建库测序方法技术

技术编号:37101847 阅读:19 留言:0更新日期:2023-04-01 05:02
本发明专利技术公开了单细胞全长转录本建库测序方法。本发明专利技术提供了一种单细胞全长转录本建库测序方法,包括如下步骤:A)对单细胞的mRNA进行单细胞标记和U组合标记;B)将所述双标记cDNA进行预扩增、打断、文库构建,得到单细胞全长转录本文库;C)测序所述单细胞全长转录本文库,实现单细胞全长转录本建库测序。本发明专利技术使用胞嘧啶与甲基化胞嘧啶或羟甲基化胞嘧啶可以在重亚硫酸盐或脱氨酶的作用发生转化而发生碱基改变(变成T)基础上,使用甲基化胞嘧啶或羟甲基化胞嘧啶在逆转录时加入到cDNA上的位置组合来对原始的RNA分子进行标记,利用标记来确定测序序列是否来自同一RNA分子,从而组装成全长转录本。组装成全长转录本。

【技术实现步骤摘要】
一种单细胞全长转录本建库测序方法


[0001]本专利技术属于生物
,尤其涉及一种单细胞全长转录本建库测序方法。

技术介绍

[0002]单细胞转录组测序是对单个细胞的转录组进行测序,是目前高通量测序技术中被用的最广泛的技术之一,可以对组织或细胞在特定时间或功能状态下转录的RNA进行高通量测序。单细胞转录组测序让对细胞的异质性、细胞发育、肿瘤微环境等研究从混合细胞到了单细胞的水平,可以进一步揭示了生物体的细胞水平的变化规律,为精准医疗带来巨大的进步。单细胞转录组技术可以将细胞分为不同的类型,同时可以将同种类型的细胞区分为不同亚型。而且已经可以利用微孔芯片或油包水液滴等技术或产品,实现一次对成千上万的单细胞进行转录组建库测序,例如10xgenomics的单细胞RNA测序产品或者BD公司的相应产品。高通量单细胞转录组测序技术的出现,使得研究人员可以对更多不同物种的不同组织的细胞进行大规模的转录组分析,构建细胞图谱,研究细胞类群与细胞个体的差异,更好的理解不同组织细胞的功能与变化。但是目前常用的高通量单细胞转录组测序方案都只能获得mRNA 3

端的信息,只能对基因的表达量进行分析,而无法获得全长转录本的信息,丢失了大量信息,造成无法对基因的可变剪切以及其Isoform进行深入研究。高通量单细胞全长转录组测序技术可以同时对大量单细胞进行全长转录组测序,获得每个细胞中mRNA的完整信息,除基因表达量以外,还可以分析同一个基因在不同细胞中的表达形式,对以往由不同基因的表达量的差异而区分出来的细胞类群进行进一步的分析。拥有转录本的完整RNA序列可以揭示RNA是如何被处理的(例如,通过编码部分的选择性剪接),以及RNA是由母亲还是父亲的基因复制(等位基因)产生的。
[0003]解决上述问题的方案目前有如下两种:
[0004]一、成熟的高通量单细胞RNA建库技术结合单分子测序:
[0005]比如利用10X Genomics公司的单细胞RNA建库试剂盒得到单个细胞的全长cDNA文库,然后用Pacbio平台或ONT平台的建库技术进行建库,然后利用单分子测得单个细胞全长转录本,通过研究不同亚群细胞的转录本特征,发现了亚群特异的转录本,这从另外一个视野研究了细胞的异质性。单细胞RNA建库结合单分子测序具体方案:使用现有smart

seq或smart

seq2的方法得到单细胞中全长的cDNA,即采用带有oligo

dT的逆转录引物与单细胞中的mRNA上的polyA进行杂交,使用的MMLV逆转录酶可以在完成全长RNA逆转录后,在cDNA的5

末端加上3个C碱基,然后使用TSO(Template switch oligo)引物进行模板转换,TSO引物3

由3个鸟嘌呤核糖核苷酸(rGrGrG)和5

的同用引物组成,完成逆转录后,使用通用引物可以扩增得到全长的双链cDNA,再根据使用的单分子测序平台对应的建库技术,进行建库(比如Pacbio和ONT),之后对全长的cDNA文库进行测序,从而得到单细胞的全长转录本。
[0006]单细胞RNA建库再结合单分子测序在一定程度上解决了无法获得单细胞全长转录本的问题。但是目前的高通量单细胞RNA建库试剂和单分子测序的成本都非常高,两者结合起来之后成本成倍增加,让这个方法难以大规模推广。而且目前的单分子测序的测序准确
性偏低,在对转录本进行定量时,会造成定量的准确性降低,为了增加准确性,需要加大数据量,这又进一步增加了测序成本。因此,单细胞RNA建库结合单分子测序的方案虽然能得到完整的全长转录本,但是成本很高;同时由于单分子测序的准确性较低,会影响转录本分析的准确性,如果需要得到测序准确性高的数据,就需要加大测序量,这样则进一步增加了测序成本。所以需要一个低成本的单细胞全长转录本的方案。
[0007]二、smart

seq3技术实现低成本的单细胞全长转录组
[0008]在smart

seq2的基础上,通过改进开发的smart

seq3技术是一种低成本的单细胞全长转录组的解决方案。这种方式得到的转录本当然没有Pacbio等三大方法得到的全长转录本长与完整,但是相对于普通单细胞转录组来说,转录本长度大大增加了,提供了单细胞水平的转录组的特征。Smart

seq3建库方法的方案:其建库方式基本上与smart

seq2一致,不同点在于:在Tn5转座酶包埋序列中带有唯一标签序列(UMI),其建库流程是先通过oligo

dT的引物与含有polyA尾巴的mRNA杂交,使用逆转录酶进行逆转录,在完成全长RNA逆转录后,逆转录酶在cDNA的5

末端加上3个C碱基,然后使用TSO引物进行模板转换,TSO引物由3个鸟嘌呤核糖核苷酸(rGrGrG)和UMI序列和Tag序列以及Tn5通用序列组成,完成逆转录后,合成全长cDNA文库。再通过PCR扩增,将逆转录得到的序列进行扩增,扩增出多条带相同标签的序列。再使用Tn5转座酶进行打断和标记以构建测序上机文库,之后对文库进行双端测序。得到的双端序列,挑选带有唯一标签序列的reads来构建延伸转录本。在构建转录组的过程中,主要是挑选5

端UMI序列的双端序列,对于来自同一个转录本的reads,其5

端的reads带有的UMI序列是一致的,但是3

端的序列不一致,因此可以将具有相同UMI的5

端的序列与不同3

端的序列进行合并,延伸转录本,得到更长的转录本(图1,参考文献:Hagemann

Jensen,M.,et al.(2020)."Single

cell RNA counting at allele and isoform resolution using Smart

seq3."Nat Biotechnol 38(6):708

714.)。
[0009]Smart

seq3的建库方法虽然可以得到较长的转录本,但是对数据的利用率低,位于mRNA中间的reads由于没有对应的5

端UMI信息,无法对应到相应转录本上而无法使用,造成数据浪费。并且需要长短不同文库来保证延伸的转录本长度,造成文库长度不均一,影响测序质量,并且由于过长的文库的测序难度也会增加,所以最终的转录本的长度和完整度会受到限制。由于以上问题,这个方法在高通量单细胞RNA测序上的应用时,会浪费更多数据,也难以得到的完整的全长转录本长。
[0010]因此,选择一种更为合适的高通量单细胞全长转录组测序技术成为研究的热点。

技术实现思路

[0011]本专利技术的一个目的是提供一种单细胞全长转录本建本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种单细胞全长转录本建库测序方法,包括如下步骤:A)对单细胞的mRNA进行双标记和C转化,得到双标记cDNA;所述双标记包括单细胞标记和U组合标记;所述单细胞标记为用带有单细胞标记序列的PolyT的oligo引物捕获所述mRNA;所述U组合标记为将所述mRNA在模板转换TSO引物和逆转录酶作用下进行逆转录和模板转换反应,且反应时加入甲基化C或羟甲基化C进行实现再次标记,形成带有甲基化C和非甲基化C组合标记的cDNA;所述C转化为将带有单细胞标记序列以及甲基化C和非甲基化C组合标记的cDNA中的甲基化C或非甲基化C转化为U,得到不同位置U碱基和非甲基化C的组合标记的cDNA或不同位置U碱基和甲基化C的组合标记的cDNA,记作双标记cDNA;B)将所述双标记cDNA进行预扩增、打断、文库构建,得到单细胞全长转录本文库;C)测序所述单细胞全长转录本文库,实现单细胞全长转录本建库测序。2.根据权利要求1所述的方法,其特征在于:步骤A按照如下方法实现:1)裂解单细胞mRNA,再采用所述PolyT的oligo引物捕获所述mRNA,得到带有PolyT的oligo引物结合的mRNA;2)将带有单细胞标记的mRNA在所述模板转换TSO引物和逆转录酶作用下进行逆转录和模板转换反应,且反应时加入甲基化C或羟甲基化C实现再次标记,得到带有单细胞标记序列以及甲基化C和非甲基化C组合标记的cDNA;3)将所述带有单细胞标记序列以及甲基化C和非甲基化C组合标记的cDNA中的甲基化C转化为U,得到不同位置U碱基和非甲基化C的组合标记的cDNA,记作双标记cDNA;或将所述带有单细胞标记序列以及甲基化C和非甲基化C组合标记的cDNA中的非甲基化C转化为U,得到不同位置U碱基和甲基化C的组合标记的cDNA,记作双标记cDNA。3.根据权利要求1所述的方法,其特征在于:所述步骤A照如下方法实现:1)...

【专利技术属性】
技术研发人员:夏军刘萍赵霞张恬颖宋喆史千玉杨新
申请(专利权)人:深圳华大智造科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1