当前位置: 首页 > 专利查询>南开大学专利>正文

整合单细胞转录组与空间转录组数据的分析方法及系统技术方案

技术编号:34692227 阅读:116 留言:0更新日期:2022-08-27 16:26
本发明专利技术提出了整合单细胞转录组与空间转录组数据的分析方法及系统,包括:获取空间转录组数据,对空间转录组数据进行预处理;通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,基于筛选出在空间中具有差异性表达的基因得出每个细胞亚群的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。中的分布。中的分布。

【技术实现步骤摘要】
整合单细胞转录组与空间转录组数据的分析方法及系统


[0001]本专利技术属于数据分析
,尤其涉及整合单细胞转录组与空间转录组数据的分析方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]近年来,随着空间测序技术的兴起,对于从RNA水平对基因表达的转录组学研究正在从一维的单细胞转录组学转向二维的空间转录组学。由于空间转录组测序技术自身分辨率的局限性,目前还不能直接通过空间转录组学得到细胞亚群在组织切片中的分布。因此,越来越多的研究通过整合单细胞转录组与空间转录组数据,以给出细胞在组织切片中的分布,进而研究细胞的空间异质性、不同区域的细胞富集和交互等,为更多的生物学发现提供可能。
[0004]专利技术人发现,随着空间转录组测序技术的不断发展和完善,下游的整合分析技术也不断涌现。但是,这些分析工具往往只针对特定的测序技术,或特定的分析任务,无法满足当下空间转录组的分析需求。

技术实现思路

[0005]为克服上述现有技术的不足,本专利技术提供本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.整合单细胞转录组与空间转录组数据的分析方法,其特征是,包括:获取空间转录组数据,对空间转录组数据进行预处理;预处理之后去除空间转录组数据中游离的mRNA和处理基因表达的缺失值,得到去污染后的空间表达矩阵;利用去污染后的空间表达矩阵、采样点在组织切片中的位置信息和组织学影像,通过聚类方法将空间转录组数据中的采样点划分为若干个类别,每一个类别表示组织切片图像中一个组织区域;根据去污染后的空间基因表达数据,和空间聚类步骤的结果,筛选出在空间中具有差异性表达的基因;根据输入的单细胞数据进行分析,得出每个细胞亚群在单细胞高表达基因下的表达模式;根据单细胞数据集中的细胞亚群表达模式,将所有spot的基因表达作为输入,获得细胞类型在各个组织区域中的分布。2.如权利要求1所述的整合单细胞转录组与空间转录组数据的分析方法,其特征是,还包括可视化步骤:在组织切片图像上,标注出采样点的所在位置,然后用不同颜色标记每个采样点的类别,每一种类别表示一个组织区域,以表示组织区域分割结果。3.如权利要求1所述的整合单细胞转录组与空间转录组数据的分析方法,其特征是,获取的空间转录组数据,包括:每个采样点的基因表达组成的表达矩阵、不同分辨率下的组织切片图像、每个采样点在组织切片图像中的具体位置和原始高分辨率图像与低分辨率图像之间的比例因子;其中,组织切片,指的是载有生物组织的染色芯片,其上的采样点呈点阵排列,一部分采样点位于组织上,一部分采样点位于组织外。4.如权利要求1所述的整合单细胞转录组与空间转录组数据的分析方法,其特征是,对空间转录组数据进行预处理,具体包括:筛选出位于组织上的采样点;过滤在所有采样点中表达值过低的基因和线粒体基因;其中,线粒体基因,指线粒体中携带的遗传信息,在基因信息中以“MT
‑”
为前缀进行标记。5.如权利要求1所述的整合单细胞转录组与空间转录组数据的分析方法,其特征是,去除空间转录组数据中游离的mRNA,具体包括:读取组织外采样点的表达值进行建模,推断出背景噪声的分布,再将组织区域内的spot表达值分解为实际的表达值和背景噪声两部分,消去组织内的背景噪声,其中,背景噪声指组织外采样点的基因表达模式。6.如权利要求1所述的整合单细胞转录组与空间转录组数据的分析方法,其特征是,处理空间转录组基因表达的缺失值,具体包括:分别在每个采样点在组织切片图像中的具体位置信息层面,以及空间表达矩阵层面层面上分别寻找相似的采样点,...

【专利技术属性】
技术研发人员:刘健阮志涵陈娇
申请(专利权)人:南开大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1