【技术实现步骤摘要】
本专利技术属于单细胞类型注释,尤其涉及一种基于分布与知识对齐的单细胞多组学细胞类型注释方法。
技术介绍
1、单细胞类型注释对于理解肿瘤微环境至关重要。随着单细胞测序技术的进步,研究人员现在可以在单细胞水平上分析不同细胞类型的功能特征。然而,现有的注释方法难以处理单细胞数据中的高维稀疏性和技术噪声。传统方法主要依赖转录组数据,忽略了互补的多组学信息,导致信息丢失和准确性降低。而现有的多组学方法,由于模型的复杂性,大多需要很高的训练和预测成本。
2、随着scatac-seq等新兴技术的出现,多组学测序方法获得了显著关注,提供了前所未有的机会用于多维数据的整合分析。通过结合转录组学和表观基因组学等不同的组学维度,多组学数据能更加全面地理解细胞调控网络,并更精确地表征细胞状态和功能。然而,多组学数据固有的高维性、稀疏性和分布异质性为整合分析带来了困难。解决这些困难需要开发有效的计算模型,能够协调多组学数据集之间的分布,同时捕捉它们的共享特征。这仍然是当前研究的一个重点。
3、现有的多组学数据整合策略大致可以分为两种范式。
...【技术保护点】
1.一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述多组学变分自编码器模型的预训练过程如下:
3.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述潜在表示ZRNA通过以下公式生成:
4.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述KL散度损失的公式如下:
5.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注
...【技术特征摘要】
1.一种基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述多组学变分自编码器模型的预训练过程如下:
3.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述潜在表示zrna通过以下公式生成:
4.根据权利要求2所述的基于分布与知识对齐的单细胞多组学细胞类型注释方法,其特征在于,所述kl散度损失的公式如下:
5.根据权利...
【专利技术属性】
技术研发人员:贺锶函,张永清,李天豪,何天元,王梓鉴,黄铮骁,王紫轩,刘宇航,吴晨芃,
申请(专利权)人:成都信息工程大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。