【技术实现步骤摘要】
本专利技术属于生物信息学领域,涉及一种针对不平衡单细胞rna-seq数据的细胞聚类方法、设备和介质。
技术介绍
1、随着高通量测序技术的迅猛进步,大量单细胞rna-seq数据集不断涌现,极大地推动了在这些数据基础上展开的多项研究。这一领域的深入挖掘涵盖了对细胞异质性的详尽分析、细胞轨迹的推断、细胞间通讯的深入研究,以及基因调控网络等多个方面。在这些研究中,细胞异质性分析和稀有细胞识别等方向的探索变得至关重要,而聚类方法则成为这些分析的关键技术之一。
2、然而,单细胞rna-seq数据本身具有高维度、高稀疏性和高噪声等特征,这为相关研究带来了许多在计算方面的挑战。因此,提出专门针对单细胞数据特性的细胞聚类方法对于推动基于单细胞rna-seq数据的深入分析与研究具有重大意义。这些新颖的方法的引入将有助于克服数据方面的困难,为更深入、更准确地理解单细胞层面的生物学过程提供有力支持。这不仅有助于解决计算问题,还为揭示细胞之间复杂相互关系、更全面地描绘基因调控网络等方面的生物学现象提供了创新性的途径。目前单细胞rna-seq数据的聚类
...【技术保护点】
1.一种针对不平衡单细胞RNA-seq数据的细胞聚类方法,其特征在于,包括:
2.根据权利要求1所述的细胞聚类方法,其特征在于,对基因表达矩阵进行预处理包括:
3.根据权利要求1所述的细胞聚类方法,其特征在于,步骤2中计算的相似度采用余弦相似度;对于每个细胞,与其相似度最高的C个细胞作为选出的C个近似细胞。
4.根据权利要求1所述的细胞聚类方法,其特征在于,所述对比学习模型由双分支结构组成,第一分支由query encoder与projector组成,query encoder输出细胞的潜在表征,第二分支由pruned moment
...【技术特征摘要】
1.一种针对不平衡单细胞rna-seq数据的细胞聚类方法,其特征在于,包括:
2.根据权利要求1所述的细胞聚类方法,其特征在于,对基因表达矩阵进行预处理包括:
3.根据权利要求1所述的细胞聚类方法,其特征在于,步骤2中计算的相似度采用余弦相似度;对于每个细胞,与其相似度最高的c个细胞作为选出的c个近似细胞。
4.根据权利要求1所述的细胞聚类方法,其特征在于,所述对比学习模型由双分支结构组成,第一分支由query encoder与projector组成,query encoder输出细胞的潜在表征,第二分支由pruned momentum encoder与momentum projector组成;其中,prunedmomentum encoder是一个经过剪枝后的稀疏模型,表示为fk,其参数表示为θk,θk不需要经过后向传播来进行更新;momentum projector是一个参数不需要经过后向传播进行更新的稠密模型,表示为fmp,其参数表示为θmp;设fq表示query encoder模型,fp表示projecto...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。