一种空间转录组测序数据的分析方法技术

技术编号:27730915 阅读:16 留言:0更新日期:2021-03-19 13:21
本发明专利技术属于生物技术和生物信息技术领域,具体涉及一种空间转录组测序数据的分析方法。本发明专利技术提供的测序数据的分析方法,主要包括样本检测建库和测序数据生物信息分析等过程。本发明专利技术提供了全面、系统的空间转录组测序建库和数据生物信息分析方法,利用Spot捕获技术,将基因表达信息映射到组织切片中,真实还原基因的空间分布状态,让异质性研究更为清晰,有效降低了新兴组学空间转录组数据处理的复杂度。

【技术实现步骤摘要】
一种空间转录组测序数据的分析方法
本专利技术属于生物技术和生物信息
,具体涉及一种空间转录组测序数据的分析方法。
技术介绍
随着生物行业的技术进步,高通量测序技术在各领域研究中发挥了重要作用,但随着各领域研究的深入,仍有些问题传统高通量测序技术无法得到解决。这是由于传统组学技术收集离体的组织或者细胞进行高通量测序,技术在建库的过程中自然导致细胞在组织中原位置的不可还原性,也致使组织微环境、细胞联系无法还原。对于组织测序,(1)细胞微环境难以捕获,不同于大环境的研究,细胞本身的体积很小,细胞的微环境又是由细胞间的关联性构建的有机整体。虽然近几年来单细胞测序技术迅速成熟,但是单细胞转录组依然无法记录细胞间关联信息(单细胞悬液制备破坏了细胞的原始位置信息),缺失了微环境的有序完整性。所以如何有效获得这个有效整体,一直是相关研究的难点之一;(2)细胞微环境研究手段有限,单细胞转录组空间序列分析的方法出现,再结合FISH验证,确实在很大程度上推进了细胞微环境的研究。但是,这种空间序列分析获得的数据有效性相对较低。细胞微环境对分子机理的研究有至关重要的推进作用,例如肿瘤微环境对肿瘤的发生、进程和抗药性都有重要影响,渐冻症也认为运动神经和神经胶质的交流受阻是重要的发病起因,作物根系发育同样也受到了内源性共生菌构建的微环境影响,因此急需快速挖掘细胞微环境分子特征的有效手段。对于空间转录组数据分析方面,因其组织测序的复杂性、数据量大和空间异质性的存在使得数据分析有很大的难度。而空间转录组作为新兴技术,技术涵盖肿瘤、发育、免疫、疾病等多领域,涉及肿瘤、淋巴、大脑、心脏等多种组织,可以应用于动物,也可应用于植物,应用范围和价值极为广阔。鉴于上述空间转录组建库和数据分析中的需求,目前尚未有技术公开对空间转录组测序和数据生物信息分析的方法,来解决以上困难,限制了相关领域的科研问题的突破和应用的推广。
技术实现思路
针对现有技术普遍存在的缺陷,本专利技术创造性的提供了一种空间转录组测序数据的分析方法。本专利技术提供的方法真实还原了基因的空间分布状态,让异质性研究更为清晰,有效降低了新兴组学空间转录组数据处理的复杂度。为了达到上述目的,本专利技术采用的技术方案为:一种空间转录组测序数据的分析方法,包括如下过程:S1、样本检测建库;S2、测序数据的生物信息分析。优选地,步骤S1包括如下过程:(1)样本准备:将组织速冻后,使用OCT包埋剂对组织进行包埋,在低温环境(一般为-10℃,组织不同,上、下微有浮动)下,使用冷冻切片技术从组织块上切取一张长、宽各10mm,10μm厚的切片分别贴附到组织优化芯片或文库制备芯片上,然后使用预冷甲醇固定切片,苏木精-伊红染色法对切片进行染色,组织染色结果通过明场显微镜记录组织形态和spot位置;(2)组织优化:使用组织优化芯片对组织透化时间进行优化,首先,设置梯度透化时间向完成了明场成像的芯片添加组织透化液;然后在透化完成的芯片上进行荧光反转录,将成功捕获的mRNA反转录为带荧光标签的cDNA;反转录完成后,去除掉芯片上的组织;最后,使用荧光显微镜对芯片进行成像,依据荧光成像结果的亮度、弥散程度和组织透化时间选取最佳组织透化时间用于文库构建;(3)文库制备:使用文库制备芯片进行空间转录组文库制备,将完成了明场成像的芯片按照最佳组织透化时间进行组织透化,释放组织mRNA与芯片上的捕获序列结合,逆转录合成cDNA片段并标记空间位置,PCR扩增合成cDNA二链,通过碱性环境使cDNA变性将cDNA二链释放到液体游离环境,以cDNA二链为模板进一步扩增合成大量cDNA,将cDNA酶切打断成200-300bp的片段,加上P5接头、i5样本索引、read2、i7样本索引和P7接头构建标准测序文库;(4)文库测序:利用Illumina测序平台的双端测序模式对建好的文库进行高通量测序,在Read1端,包含了16bp的barcode信息和12bp的UMI信息用于确定转录本位置和表达量定量;在Read2端,包含了cDNA片段,用于参考基因组比对确定mRNA所对应的基因。优选地,步骤S2包括如下过程:(1)测序数据质控及基因表达量定量;(2)spots聚类分群分析;(3)亚群特征基因分析;(4)空间特征基因分析。优选地,步骤S2中的过程(1)的具体操作如下:①数据测序的基本质控:将测序原始数据输入spaceranger中,对spot位置进行比对获得覆盖在组织切片下的spot作为有效spot,结合芯片的序列号获得有效spot对应的barcode信息,基于有效barcode信息,对测序数据的reads质量、测序饱和度和有效barcode进行评估;②参考基因组比对和基因组表达定量:将reads在spaceranger中与参考基因组进行比对,对所有spot的基因数、有效reads数等参数进行统计评估,根据基因组比对结果、UMI计数和barcode序列信息,获得不同基因在不同的spot中的表达量丰度信息。优选地,步骤S2中的过程(2)的具体操作如下:①数据归一化:使用SCTransform算法对基因表达量进行均一化处理;②主成分分析:利用均一化的表达量进行PCA分析,减少背景噪音对聚类和降维的影响;③spot聚类:Seurat的基于图论的聚类方法对spot进行聚类和分群;④tSNE可视化:基于spot亚群分类结果,进一步使用tSNE非线性降维的方法将所有spot投影至二维平面中可视化。优选地,步骤S2中的过程(3)的具体操作过程如下:①亚群差异表达分析:使用Seurat的MAST检验分别对不同spot亚群进行亚群上调基因分析,并筛选显著上调基因;②亚群差异基因功能分析:对筛选的亚群上调基因进行KEGG富集分析,DO富集分析,GO富集分析,Reactome富集分析等分析;③亚群特征基因筛选和分析:进一步挑选每个亚群表达量上调倍数最高的20个基因做为亚群特征基因,并以热图、组织映射图和气泡图来展示基因分布特征;④亚群特征基因蛋白质互作网络分析:通过string数据库,获得蛋白质间互作信息,通过这些信息,建立亚群特征基因间的蛋白质互作网络,进一步了解不同spot亚群之间存在的潜在的调控关系。优选地,步骤S2中的过程(4)的具体操作过程如下:①空间差异基因分析:通过Seurat的markvariogram算法对高变基因进行检验,再通过trendsceek的mark-segregation假设检验对基因显著性进行检验,最后通过BH法对显著性P值进行多重检验矫正,通过特定条件筛选空间差异基因;②空间差异基因功能分析:对筛选的空间差异基因,进行KEGG富集分析,DO富集分析,GO富集分析,Reactome富集分析等分析;③空间特征基因筛选和分析:进一步挑选P值最小的200个基因作为空间特征基因,并以热图、组织映射图和本文档来自技高网
...

【技术保护点】
1.一种空间转录组测序数据的分析方法,其特征在于,包括如下过程:/nS1、样本检测建库;/nS2、测序数据的生物信息分析。/n

【技术特征摘要】
1.一种空间转录组测序数据的分析方法,其特征在于,包括如下过程:
S1、样本检测建库;
S2、测序数据的生物信息分析。


2.如权利要求1所述的空间转录组数据生物信息分析方法,其特征在于,步骤S1包括如下过程:
(1)样本准备:将组织速冻后,使用OCT包埋剂对组织进行包埋,在低温环境下,使用冷冻切片技术从组织块上切取一张长、宽各10mm,10μm厚的切片分别贴附到组织优化芯片或文库制备芯片上,然后使用预冷甲醇固定切片,苏木精-伊红染色法对切片进行染色,组织染色结果通过明场显微镜记录组织形态和spot位置;
(2)组织优化:使用组织优化芯片对组织透化时间进行优化,首先,设置梯度透化时间向完成了明场成像的芯片添加组织透化液;然后在透化完成的芯片上进行荧光反转录,将成功捕获的mRNA反转录为带荧光标签的cDNA;反转录完成后,去除掉芯片上的组织;最后,使用荧光显微镜对芯片进行成像,依据荧光成像结果的亮度、弥散程度和组织透化时间选取最佳组织透化时间用于文库构建;
(3)文库制备:使用文库制备芯片进行空间转录组文库制备,将完成了明场成像的芯片按照最佳组织透化时间进行组织透化,释放组织mRNA与芯片上的捕获序列结合,逆转录合成cDNA片段并标记空间位置,PCR扩增合成cDNA二链,通过碱性环境使cDNA变性将cDNA二链释放到液体游离环境,以cDNA二链为模板进一步扩增合成大量cDNA,将cDNA酶切打断成200-300bp的片段,加上P5接头、i5样本索引、read2、i7样本索引和P7接头构建标准测序文库;
(4)文库测序:利用Illumina测序平台的双端测序模式对建好的文库进行高通量测序,在Read1端,包含了16bp的barcode信息和12bp的UMI信息用于确定转录本位置和表达量定量;在Read2端,包含了cDNA片段,用于参考基因组比对确定mRNA所对应的基因。


3.如权利要求1所述的空间转录组数据生物信息分析方法,其特征在于,步骤S2包括如下过程:
(1)测序数据质控及基因表达量定量;
(2)spots聚类分群分析;
(3)亚群特征基因分析;
(4)空间特征基因分析。


4.如权利要求3所述的生物信息分析方法,其特征在于,步骤S2中的过程(1)的具体操作如下:
①数据测序的基本质控:将测序原始数据输入spaceranger中,对spot位置进行比对获得覆盖在组织切片下的spot作为有效spot,结合芯片的序列号获得有效spot对应的barcode信息,基于有效barcode信息,对测序数据的reads质量、测序饱和度和有效barcode...

【专利技术属性】
技术研发人员:周煌凯高川陈飞钦艾鹏张秋雪
申请(专利权)人:广州基迪奥生物科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1