当前位置: 首页 > 专利查询>中南大学专利>正文

一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法技术

技术编号:28323629 阅读:32 留言:0更新日期:2021-05-04 13:04
本发明专利技术公开了一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,包括:获取多个细胞的单细胞转录组测序数据得到的基因表达矩阵,在过滤和标准化处理后,构建二维特征矩阵并进行线性归一化;根据归一化后的二维特征矩阵计算细胞间的欧式距离,从而建立细胞最小生成树;通过自适应阈值对细胞最小生成树进行切割,并以切割后构成的簇的平衡性来确定数据的二维分布结构;对具有模糊簇间边界和连续二维分布结构的数据,推荐并应用层次聚类算法,而对具有明显簇间边界和分块二维分布结构的数据,推荐并应用谱聚类算法。本发明专利技术能为单细胞转录组测序数据在层次聚类和谱聚类中推荐更适合其二维分布结构的方法作为下游聚类分析方法,提高聚类准确性。

【技术实现步骤摘要】
一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法
本专利技术涉及生物信息学领域,涉及一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法。
技术介绍
在细胞生物学领域,单细胞分析是在单细胞水平上对基因组学、转录组学、蛋白质组学和代谢组学的研究。它提供了一种超灵敏的工具来阐明特定的分子机制和途径,并揭示了细胞异质性的本质。随着技术的发展和成本的下降,应用于单细胞全基因组的转录组测序(scRNA-seq)技术正在迅速成为生物学和生物医学研究等许多领域的选择。在单细胞分辨率下研究全基因组的基因表达克服了传统RNA测序的内在局限性,单细胞转录组测序使研究人员能够更严格地解决有关组织的细胞组成,转录物异质性和细胞类型的问题,使单细胞转录组测序已用于研究癌症,宏基因组学以及调控和进化网络。近些年来,单细胞异质性分析研究成为了生物信息领域的一大研究热点。为了剖析细胞异质性,就有必要在单细胞水平进行基因表达分析。单细胞转录组测序技术能获得单个细胞内近万个基因的表达信息,为辨别生物组织中各种细胞类型的转录特征和全面揭示细胞之间的基因表达差本文档来自技高网...

【技术保护点】
1.一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,其特征在于,包括以下步骤:/n步骤1,获取N个细胞的单细胞转录组测序数据,通过统计基因在每个细胞中的表达量得到基因表达矩阵,并进行过滤和标准化处理;然后通过均匀流形近似和投影构建二维特征矩阵,并将二维特征矩阵进行线性归一化;/n步骤2,根据归一化后的二维特征矩阵,计算每两个细胞间的欧式距离,并建立基于距离矩阵的细胞最小生成树;/n步骤3,通过自适应阈值对构建的细胞最小生成树进行切割,并以切割后构成的簇的平衡性来确定单细胞转录组测序数据的二维分布结构;所述自适应阈值根据细胞数N定义得到;/n步骤4,根据数据二维分布结构的差异并结合层...

【技术特征摘要】
1.一种基于二维分布结构判定的单细胞转录组测序数据聚类推荐方法,其特征在于,包括以下步骤:
步骤1,获取N个细胞的单细胞转录组测序数据,通过统计基因在每个细胞中的表达量得到基因表达矩阵,并进行过滤和标准化处理;然后通过均匀流形近似和投影构建二维特征矩阵,并将二维特征矩阵进行线性归一化;
步骤2,根据归一化后的二维特征矩阵,计算每两个细胞间的欧式距离,并建立基于距离矩阵的细胞最小生成树;
步骤3,通过自适应阈值对构建的细胞最小生成树进行切割,并以切割后构成的簇的平衡性来确定单细胞转录组测序数据的二维分布结构;所述自适应阈值根据细胞数N定义得到;
步骤4,根据数据二维分布结构的差异并结合层次聚类和谱聚类的方法特性,对计算确定具有模糊簇间边界和连续二维分布结构的数据,推荐并使用层次聚类算法进行下游聚类分析,而对计算确定具有明显簇间边界和分块二维分布结构的数据,推荐并使用谱聚类算法进行下游聚类分析。


2.根据权利要求1所述的方法,其特征在于,所述步骤1中,对二维特征矩阵进行线性归一化的公式为:



其中,Y′表示通过均匀流形近似和投影构建的二维特征矩阵,Ymax和Ymin分别表示初始基因表达矩阵中表达量的最大值和最小值。


3.根据...

【专利技术属性】
技术研发人员:李敏田宇郑瑞清
申请(专利权)人:中南大学
类型:发明
国别省市:湖南;43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1