【技术实现步骤摘要】
一种识别疾病表型相关的细胞亚群的方法
[0001]本专利技术属于生物医学领域,具体涉及一种识别疾病表型相关的细胞亚群的方法。
技术介绍
[0002]单细胞测序技术的出现使得生物学研究领域发生了革命性的变化。在过去十年中,随着单细胞测序技术的快速发展和单细胞数据的爆发式增长,单细胞分析在生命科学和精准医学方面得到了越来越多的关注。如今,我们已经能够获得单个细胞的基因组、转录组、表观基因组学等数据并在全基因组的水平上对细胞的DNA、RNA、组蛋白修饰、染色体可及性、DNA甲基化等方面进行进一步的研究。其中,单细胞RNA测序更是处在这些方法的前沿,其在吞吐量方面从最初的不足100个细胞,到如今一次实验的数万甚至数十万个细胞。单细胞RNA测序在处理微量RNA的技术上也有了长足的进出,提高了单细胞RNA测序在小样本上的稳定性。
[0003]单细胞数据分析的一般思路是通过标准化,特征选择,降维,聚类等方法在异质性组织中识别不同细胞亚群的细胞类型和推导细胞分化轨迹。单细胞测序能在单个细胞的水平上深入分析组织的异质性和识别影响疾病表 ...
【技术保护点】
【技术特征摘要】
1.一种识别疾病表型相关的细胞亚群的方法,其特征在于,包括如下步骤:S1、基于GeneExpressionOmnibus数据库收集疾病的单细胞RNA测序数据得到单细胞表达矩阵,基于TheCancerGenomeAtlas数据库收集疾病的bulk表达矩阵和对应的表型标签,基于MINT数据库下载人类蛋白质相互作用数据构建蛋白质相互作用网络;S2、从步骤S1得到的单细胞表达矩阵和疾病的bulk表达矩阵提取细胞和样本的基因特征签名,并将细胞和样本的基因特征签名映射到蛋白质相互作用网络中形成相应的细胞模块、样本模块;S3、基于蛋白质相互作用网络中的最短路径长度,计算步骤S2映射到蛋白质相互作用网络中的每个细胞模块和每个样本模块之间的距离,基于表型标签确定多个样本模块的集合作为疾病表型的样本模块集合;S4、基于步骤S3得到的疾病表型的样本模块集合,计算细胞模块与疾病表型的样本模块集合之间的距离;S5、创建背景距离分布评估细胞模块与疾病表型的样本模块集合间距离的统计显著性,并确定与疾病表型的样本模块集合距离显著小于背景距离分布的细胞。2.根据权利要求1所述的一种识别疾病表型相关的细胞亚群的方法,其特征在于,步骤S1中所述单细胞表达矩阵和疾病的bulk表达矩阵经过TPM/FPKM归一化处理,并且基因作为矩阵的行,细胞或样本作为矩阵的列。3.根据权利要求2所述的一种识别疾病表型相关的细胞亚群的方法,其特征在于,步骤S2中所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。